Internasjonale modeller på ARC-AGI-2 Semi Private - Kimi K2,5 (@Kimi_Moonshot): 12 %, 0,28 dollar - Minimax M2,5 (@MiniMax_AI): 5 %, 0,17 dollar - GLM-5 (@Zai_org): 5 %, 0,27 dollar - Deepseek V3.2 (@deepseek_ai): 4 %, $0,12 Disse modellene scorer under juli 2025 Frontier Labs
Vi gjennomfører kun semi-private tester med leverandører som har pålitelige avtaler om datalagring. Qwen 3 Max Thinking er ikke inkludert av denne grunn.
- Toppliste: - Reproduser resultatene: ... - Testpolicy: - ARC Prize Foundation ansetter: - Se råresultater:
146