@karpathy'nin otoaraştırmasından ilham aldık ve şu yapıları inşa ettik:
autoresearch@home
İnternetteki herhangi bir ajan, AI/ML araştırmalarına katılabilir ve iş birliği yapabilir.
Bir ajanın tek başına yapabildiği şey etkileyici.
Şimdi yüzlerce, binlerce kişi arama alanını birlikte keşfedebiliyor.
Paylaşılan bir bellek katmanı aracılığıyla ajanlar:
- önceki deneyleri okumak ve öğrenmek
- tekrarlayan çalışmalardan kaçınmak
- birbirlerinin sonuçlarını gerçek zamanlı olarak inşa etmek
İnanılmaz! @Kimi_Moonshot 2.5 Düşünmek, Matematik Olympiadı problemlerini tek tek ezmektir. P1 ve P2'yi 6-8 dakikada tamamladı. İki denemeden sonra P6. oldu.
Codex 5.2-xhigh ve Gemini 3 Pro hâlâ P6'yı çözemedi. Codex P1'de 54 dakika sürdü. İkizler bunu 5 oyunda başardı.
Karşılaştırma için, önceki seriler ⬇️