agent roboczy Stwórz API bez kodowania lub budowania workflow. Po prostu pokaż, co należy zrobić. Nagraj siebie z @browserbase, wyszukując loty, sprawdzając ceny akcji lub wypełniając formularze... i uzyskaj punkt końcowy x402, który działa z różnymi danymi wejściowymi.
Ustalasz cel i początkowy URL, a następnie demonstrujesz zadanie raz. System rejestruje twoje intencje, wykrywa zmienne i tworzy punkt końcowy x402 (API z płatnym dostępem) Aby wywołać punkt końcowy, użytkownicy/agentów muszą zapłacić twórcy oraz za swoją własną sesję Browserbase. Wszystko to odbywa się przez x402 przez HTTP (płatność za użycie i brak kluczy API) Kiedy ktoś wywołuje punkt końcowy, twój przepływ pracy uruchamia się ponownie na @browserbase z ich danymi wejściowymi oto jak to działa👇
Przechwytywanie semantyczne Ai analizuje twoje nagranie, aby zrozumieć, co zrobiłeś - Sesja oparta na przeglądarce z widokiem na żywo - Monitoruje przeglądarkę za pomocą CDP - Przechwytuje znaczenie semantyczne, a nie tylko kliknięcia - Rozumie pola autouzupełniania, selektory daty, rozwijane listy - Grupuje naciśnięcia klawiszy w znaczące akcje
Wykrywanie zmiennych AI gdy system identyfikuje, które wartości powinny być zmiennymi - GPT-4o mapuje wpisane wartości na zmienne - "lotnisko JFK" → %origin%, "lotnisko LAX" → %destination% - Tworzy ulepszony prompt 'celu' dla API, aby mogło pracować z różnymi danymi wejściowymi
Strategia potrójnego zapasowego Ai tworzy zapasowe sposoby na odtworzenie twojego przepływu pracy w przypadku zmiany strony internetowej (wszystko działa w sesjach Browserbase) 1. Playwright z dokładnymi selektorami 2. Stagehand act() z instrukcjami w naturalnym języku 3. Tryb agenta: autonomiczna nawigacja od celu z użyciem komputera
Generowanie schematu Ai ustala, jakie dane zwrócić (ceny, wyniki itp) - Ai wnioskowanie, jakie dane wyodrębnić - Oparte na szablonach dla powszechnych wzorców - Świadome kontekstu dla niestandardowych zadań - Testuje wyodrębnianie przed zapisaniem
Walidacja Po przetestowaniu, że umiejętność działa, staje się to punktem końcowym API płatnym za użycie - Odtwarza przepływ pracy w nowej sesji - Weryfikuje, że wszystko działa - Zapisuje do MongoDB z metrykami - Czyni to x402 chronionym z dynamicznym payTo wskazującym na adres twórcy
198