Gemini 3 深度思考 (2/26) 半私密評估 - ARC-AGI-1: 96.0%,$7.17/任務 - ARC-AGI-2: 84.6% $13.62/任務 來自 @GoogleDeepMind 的新 ARC-AGI SOTA 模型
ARC-AGI-1 排行榜
- 排行榜: - 重現結果: - 測試政策:
174