Mezinárodní modely na polosoukromém ARC-AGI-2 - Kimi K2.5 (@Kimi_Moonshot): 12 %, 0.28 $ - Minimax M2.5 (@MiniMax_AI): 5 %, 0,17 $ - GLM-5 (@Zai_org): 5 %, 0,27 $ - Deepseek V3.2 (@deepseek_ai): 4 %, 0,12 $ Tyto modely dosahují skóre pod červencovými laboratořemi 2025
Polosoukromé testování provádíme pouze u poskytovatelů, kteří mají důvěryhodné dohody o uchovávání dat. Qwen 3 Max Thinking není z tohoto důvodu zahrnut.
- Žebříčko: - Reprodukovat výsledky: ... - Testovací politika: - ARC Prize Foundation přijímá: - Zobrazit surové výsledky:
145