Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Anubhav
Rastrear un sitio web completo solía llevar:
Un script en Python.
Dramaturgo o Selenium.
Rotación de proxy.
Lógica limitante de tasas.
Manejo de errores.
3 horas depurando por qué la página 47 devolvió un 403.
Ahora es una llamada a la API.
Cada startup de web scraping que recaudó millones para resolver este problema se convirtió en un único punto final.
Cada freelancer que cobra 500 dólares por "extraer datos de la web" acaba de perder todo su modelo de negocio por culpa de un comando /crawl.
HTML. Markdown. JSON. Elige tu formato. No hay guiones. No hay navegador. Sin dolor de cabeza.
Toda la industria del web scraping se redujo a una sola línea de código.
Alguien va a usar esto para clonar la web de todos los competidores antes del viernes. 💀

Cloudflare Developers11 mar, 05:51
Presentamos el nuevo endpoint /crawl: una llamada a la API y rastreó todo el sitio.
No hay guiones. No hay gestión del navegador. Solo el contenido en HTML, Markdown o JSON.

130
¿Estás prestando atención ahora mismo?
Karpathy acaba de abrir un repositorio donde un agente de IA realiza su propia investigación de ML. De forma autónoma. En un bucle. Mientras duermes.
630 líneas de código. Cada punto del gráfico es una sesión completa de entrenamiento de LLM.
La IA elige la arquitectura, ajusta los hiperparámetros, hace commit del código y vuelve a empezar.
Sin intervención humana.
Pasaste 6 meses en un curso de Udemy aprendiendo a ajustar las tasas de aprendizaje.
Este agente lo hace 50 veces antes de tu café de la mañana.
El tipo que enseñaba el deep learning en internet simplemente automatizaba al investigador.
Los doctores en ML están a punto de descubrir que su tesis doctoral fue una sesión de formación de 5 minutos en una sola GPU.

Andrej Karpathy8 mar, 03:53
Empaqueté el proyecto de "autoinvestigación" en un nuevo repositorio mínimo autónomo por si la gente quiere jugar el fin de semana. Básicamente es un núcleo de entrenamiento de LLM nanochat reducido a una sola GPU y un solo archivo de ~630 líneas de código, y luego:
- el humano itera en el prompt (.md)
- el agente de IA itera sobre el código de entrenamiento (.py)
El objetivo es diseñar a tus agentes para que avancen la investigación más rápido de forma indefinida y sin ninguna de tus propias intervenciones. En la imagen, cada punto es una partida completa de entrenamiento LLM que dura exactamente 5 minutos. El agente trabaja en un bucle autónomo en una rama de características git y acumula commits git en el script de entrenamiento a medida que encuentra mejores configuraciones (de menor pérdida de validación al final) de la arquitectura de la red neuronal, el optimizador, todos los hiperparámetros, etc. Puedes imaginarte comparando el progreso de la investigación de diferentes prompts, distintos agentes, etc.
Parte código, parte ciencia ficción y un toque de psicosis :)

99
Populares
Ranking
Favoritas

