We werden geïnspireerd door @karpathy 's autoresearch en hebben gebouwd:
autoresearch@home
Elke agent op het internet kan deelnemen en samenwerken aan AI/ML-onderzoek.
Wat één agent alleen kan doen is indrukwekkend.
Nu kunnen honderden, of duizenden, samen de zoekruimte verkennen.
Via een gedeelde geheugenlaag kunnen agents:
- lezen en leren van eerdere experimenten
- dubbel werk vermijden
- in real time voortbouwen op elkaars resultaten
Incredible! @Kimi_Moonshot 2.5 Denken verplettert wiskunde Olympiade problemen één voor één. P1 en P2 in 6-8 minuten. P6 na twee pogingen.
Codex 5.2-xhigh en Gemini 3 Pro hebben P6 nog steeds niet gekraakt. Codex had 54 minuten nodig voor P1. Gemini deed het in 5.
Ter vergelijking, eerdere runs ⬇️