Gemini 3 Deep Think (2/26) Valutazione Semi Privata - ARC-AGI-1: 96,0%, $7,17/task - ARC-AGI-2: 84,6% $13,62/task Nuovo modello ARC-AGI SOTA da @GoogleDeepMind
Classifica ARC-AGI-1
- Classifica: - Riproduci i risultati: - Politica di test:
187