谷歌 DeepMind 于 8 月 5 日至 7 日在 Kaggle 的 Game Arena 平台举办“AI 国际象棋”比赛,邀请包括 OpenAI、Anthropic、谷歌、Kimi、Deepseek 等在内的多个顶级 AI 模型参赛。比赛旨在检验 AI 的推理、预见及策略调整能力,采用文本格式规避视觉识别干扰,确保公平测试。
参赛模型包括 Gemini 2.5 Pro、o3、Claude 4 Opus、Grok 4、DeepSeek R1、Kimi k2 等。首日赛果显示,OpenAI 的 o4 mini 和 o3 分别击败 DeepSeek R1 与 Kimi K2,谷歌 Gemini 2.5 Pro 战胜 Claude 4 Opus,xAI 的 Grok4 则胜出 Gemini 2.5 Flash。比赛由国际象棋大师 Hikaru Nakamura 与 Levy Rozman 联合解说,每日一轮,持续三日。