Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Anubhav
Ползание по всему сайту раньше занимало:
Скрипт на Python.
Playwright или Selenium.
Ротация прокси.
Логика ограничения скорости.
Обработка ошибок.
3 часа отладки, почему страница 47 вернула 403.
Теперь это один API вызов.
Каждый стартап по веб-скрапингу, который собрал миллионы, чтобы решить эту проблему, только что стал одним единственным конечным пунктом.
Каждый фрилансер, который брал $500 за "извлечение данных с сайта", только что потерял всю свою бизнес-модель из-за команды /crawl.
HTML. Markdown. JSON. Выбирайте свой формат. Никаких скриптов. Никакого браузера. Никакой головной боли.
Вся индустрия веб-скрапинга только что сократилась до одной строки кода.
Кто-то собирается использовать это, чтобы клонировать сайт каждого конкурента к пятнице. 💀

Cloudflare Developers11 мар., 05:51
Представляем новый /crawl конечный пункт - один вызов API и весь сайт проиндексирован.
Без скриптов. Без управления браузером. Только контент в HTML, Markdown или JSON.

187
Вы сейчас обращаете внимание?
Карпати только что опубликовал репозиторий, где ИИ-агент проводит собственные исследования в области машинного обучения. Автономно. В цикле. Пока вы спите.
630 строк кода. Каждая точка на графике — это полная тренировка LLM.
ИИ выбирает архитектуру, настраивает гиперпараметры, коммитит код и начинает снова.
Без участия человека.
Вы потратили 6 месяцев на курс Udemy, изучая, как настраивать скорости обучения.
Этот агент делает это 50 раз до вашего утреннего кофе.
Парень, который научил интернет глубокому обучению, только что автоматизировал исследователя.
Докторанты по машинному обучению скоро узнают, что их диссертация была 5-минутной тренировкой на одном GPU.

Andrej Karpathy8 мар., 03:53
Я упаковал проект "autoresearch" в новый самодостаточный минимальный репозиторий, если кто-то хочет поиграть в выходные. Это, по сути, ядро обучения LLM nanochat, упрощенное до версии на одном GPU, состоящей из одного файла примерно на 630 строк кода, затем:
- человек работает над подсказкой (.md)
- агент ИИ работает над кодом обучения (.py)
Цель состоит в том, чтобы разработать ваших агентов для достижения самой быстрой исследовательской прогрессии бесконечно и без вашего участия. На изображении каждая точка — это завершенный запуск обучения LLM, который длится ровно 5 минут. Агент работает в автономном цикле на ветке git и накапливает коммиты git к скрипту обучения, когда находит лучшие настройки (с меньшей валидационной потерей к концу) архитектуры нейронной сети, оптимизатора, всех гиперпараметров и т. д. Вы можете представить себе сравнение исследовательского прогресса различных подсказок, различных агентов и т. д.
Часть кода, часть научной фантастики и щепотка психоза :)

161
Топ
Рейтинг
Избранное

