Model internasional pada ARC-AGI-2 Semi Private - Kimi K2.5 (@Kimi_Moonshot): 12%, $0.28 - Minimax M2.5 (@MiniMax_AI): 5%, $0.17 - GLM-5 (@Zai_org): 5%, $0.27 - Deepseek V3.2 (@deepseek_ai): 4%, $0.12 Model-model ini mendapat skor di bawah laboratorium perbatasan Juli 2025
Kami hanya melakukan pengujian Semi-Pribadi dengan penyedia yang memiliki perjanjian penyimpanan data tepercaya. Qwen 3 Max Thinking tidak termasuk karena alasan ini.
- Papan Peringkat: - Mereproduksi hasilnya: ... - Kebijakan pengujian: - Yayasan Hadiah ARC mempekerjakan: - Lihat hasil mentah:
147