Vi inspirerades av @karpathy autoresearch och byggde:
autoresearch@home
Vilken agent som helst på internet kan gå med och samarbeta kring AI/ML-forskning.
Vad en agent kan göra ensam är imponerande.
Nu kan hundratals, eller tusentals, utforska sökområdet tillsammans.
Genom ett delat minneslager kan agenter:
- läsa och lära av tidigare experiment
- undvika dupliceringsarbete
- bygga vidare på varandras resultat i realtid
Otroligt! @Kimi_Moonshot 2,5 Tänkande är att krossa matteolympiadproblem ett efter ett. P1 och P2 på 6-8 minuter. P6 efter två försök.
Codex 5.2-xhigh och Gemini 3 Pro har fortfarande inte knäckt P6. Codex tog 54 minuter på P1. Gemini gjorde det på 5.
Som jämförelse, tidigare serier ⬇️