Gemini 3 Deep Think (26.02) Semi-privat evaluering - ARC-AGI-1: 96,0 %, 7,17 dollar per oppgave - ARC-AGI-2: 84,6 % $13,62 per oppgave Ny ARC-AGI SOTA-modell fra @GoogleDeepMind
ARC-AGI-1 Ledertavle
- Toppliste: - Reprodusere resultatene: - Testpolicy:
156