Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Anubhav
Procházení celého webu dříve zabíralo:
Python skript.
Dramatik nebo Selen.
Rotace zástupců.
Logika omezení rychlosti.
Zpracování chyb.
3 hodiny ladění proč stránka 47 vrátila 403.
Teď je to jen jeden API volání.
Každý startup na webscraping, který vybral miliony na řešení tohoto problému, se stal jediným koncovým body.
Každý freelancer, který si účtoval 500 dolarů za "extrahování dat z webu", právě přišel o celý svůj obchodní model kvůli příkazu /crawl.
HTML. Sleva. JSON. Vyberte si formát. Žádné scénáře. Žádný prohlížeč. Žádná bolest hlavy.
Celý průmysl webového scrapingu byl právě redukován na jeden řádek kódu.
Někdo to použije k tomu, aby do pátku naklonoval webové stránky všech konkurentů. 💀

Cloudflare Developers11. 3. 05:51
Představujeme nový /crawl endpoint – jedno volání API a celý web prohledaný.
Žádné scénáře. Žádná správa prohlížeče. Jen obsah v HTML, Markdownu nebo JSONu.

139
Dáváš teď pozor?
Karpathy právě otevřel zdrojový kód, kde AI agent provádí vlastní výzkum strojového učování. Autonomně. V kruhu. Zatímco spíš.
630 řádků kódu. Každý bod v grafu je kompletní tréninkový běh LLM.
AI vybere architekturu, ladí hyperparametry, commituje kód a začne znovu.
Žádná lidská účast.
Strávil jsi 6 měsíců na kurzu na Udemy, kde jsi se učil ladit rychlosti učení.
Tento agent to udělá 50krát před vaší ranní kávou.
Ten, kdo učil internet o hlubokém učení, právě zautomatizoval výzkumníka.
PhD v ML se brzy dozví, že jejich disertační práce byla pětiminutový trénink na jednom GPU.

Andrej Karpathy8. 3. 03:53
Projekt "autoresearch" jsem zabalil do nového samostatného minimálního repozitáře, pokud by si lidé chtěli zahrát o víkendu. V podstatě jde o tréninkové jádro nanochat LLM zredukované na verzi s jedním GPU a jedním souborem ~630 řádků kódu, pak:
- člověk iteruje na zadání (.md)
- AI agent iteruje na tréninkovém kódu (.py)
Cílem je inženýrsky nasměrovat své agenty tak, aby dělali nejrychlejší výzkumný pokrok neomezeně dlouho a bez vašeho zapojení. Na obrázku je každý bod kompletní tréninkový běh LLM, který trvá přesně 5 minut. Agent pracuje v autonomní smyčce na větvi funkcí git a shromažďuje git commity do trénovacího skriptu, jakmile najde lepší nastavení (s menšími ztrátami validace na konci) architektury neuronové sítě, optimalizátoru, všech hyperparametrů atd. Můžete si představit porovnávat pokrok výzkumu různých zadání, různých agentů atd.
Částečně kód, částečně sci-fi a špetka psychózy :)

122
Top
Hodnocení
Oblíbené

