Gemini 3 深度思考 (2/26) 半私密评估 - ARC-AGI-1: 96.0%,$7.17/任务 - ARC-AGI-2: 84.6% $13.62/任务 来自 @GoogleDeepMind 的新 ARC-AGI SOTA 模型
ARC-AGI-1 排行榜
- 排行榜: - 复制结果: - 测试政策:
204