Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Anubhav
Crawling un intero sito web richiedeva:
Uno script Python.
Playwright o Selenium.
Rotazione dei proxy.
Logica di limitazione della velocità.
Gestione degli errori.
3 ore di debug per capire perché la pagina 47 restituiva un 403.
Ora è una sola chiamata API.
Ogni startup di web scraping che ha raccolto milioni per risolvere questo problema è diventata un unico endpoint.
Ogni freelancer che chiedeva $500 per "estrarre dati da un sito web" ha appena perso l'intero modello di business a favore di un comando /crawl.
HTML. Markdown. JSON. Scegli il tuo formato. Niente script. Niente browser. Niente mal di testa.
L'intera industria del web scraping è stata ridotta a una sola riga di codice.
Qualcuno userà questo per clonare il sito di ogni concorrente entro venerdì. 💀

Cloudflare Developers11 mar, 05:51
Presentiamo il nuovo endpoint /crawl - una chiamata API e un intero sito viene esplorato.
Nessuno script. Nessuna gestione del browser. Solo il contenuto in HTML, Markdown o JSON.

113
Stai prestando attenzione in questo momento?
Karpathy ha appena reso open-source un repository dove un agente AI conduce la propria ricerca ML. In modo autonomo. In un ciclo. Mentre dormi.
630 righe di codice. Ogni punto nel grafico è un'intera esecuzione di addestramento LLM.
L'AI sceglie l'architettura, regola gli iperparametri, commette il codice e ricomincia.
Nessun coinvolgimento umano.
Hai trascorso 6 mesi in un corso Udemy a imparare a regolare i tassi di apprendimento.
Questo agente lo fa 50 volte prima del tuo caffè del mattino.
Il tizio che ha insegnato al mondo il deep learning ha appena automatizzato il ricercatore.
I dottorati in ML stanno per scoprire che la loro dissertazione era un'esecuzione di addestramento di 5 minuti su una singola GPU.

Andrej Karpathy8 mar, 03:53
Ho impacchettato il progetto "autoresearch" in un nuovo repository minimale e autonomo se le persone vogliono provare durante il fine settimana. È fondamentalmente il nucleo di addestramento LLM di nanochat ridotto a una versione a singolo GPU, un file di circa 630 righe di codice, poi:
- l'umano itera sul prompt (.md)
- l'agente AI itera sul codice di addestramento (.py)
L'obiettivo è ingegnerizzare i tuoi agenti per fare il progresso di ricerca più veloce indefinitamente e senza alcun tuo coinvolgimento. Nell'immagine, ogni punto è un'esecuzione completa di addestramento LLM che dura esattamente 5 minuti. L'agente lavora in un ciclo autonomo su un ramo di funzionalità git e accumula commit git allo script di addestramento mentre trova impostazioni migliori (con una perdita di validazione più bassa alla fine) dell'architettura della rete neurale, dell'ottimizzatore, di tutti gli iperparametri, ecc. Puoi immaginare di confrontare il progresso della ricerca di diversi prompt, diversi agenti, ecc.
Parte codice, parte fantascienza e un pizzico di psicosi :)

80
Principali
Ranking
Preferiti

