4比0横扫Grok 4，o3强势夺冠，首届大模型对抗赛结果出炉

美羊羊4天前教育资讯4

GPT-5 问世的同时，o3 也在最后一战中封王了。

备受 AI 圈关注的首届谷歌 Kaggle AI Chess 大赛（也即大模型国际象棋对抗赛）迎来了最终赢家。

就在昨天，Grok 4 携手 OpenAI o3 进入了决赛。在机器之心的投票中，大家更倾向于 o3 战胜 Grok 4。

中美军事对抗结果__勇士横扫骑士夺冠回放

决赛结果如大家预期的一样，o3 以 4-0 横扫 Grok 4 夺得冠军

另外，在季军争夺战中，Gemini 2.5 Pro 以 3.5-0.5（三胜一和）强势击败了 o4-mini

下图为整个赛事所有选手的对阵表以及冠亚季军得主。

_中美军事对抗结果_勇士横扫骑士夺冠回放

评论区很有意思，「Grok 4 很强，直到它遇上了 o3。」

_中美军事对抗结果_勇士横扫骑士夺冠回放

随着今晨 GPT-5 的发布，大家很好奇它会有怎样的表现呢。

勇士横扫骑士夺冠回放__中美军事对抗结果

冠亚军争夺

o3 横扫 Grok 4

一直到半决赛，Grok 4 的势头都很猛，被认为是夺冠热门。就连马斯克都「装」了起来，称 Grok 4 玩国际象棋大材小用，它本身就没有针对象棋游戏进行优化。

尽管此前偶有不灵光的地方，但 xAI 的这款大模型始终展现出了碾压级别的棋力。比赛中，Grok 4 落子时近乎冷漠的风格，更让这个招招致命的「机械野兽」看起来不可战胜。

然而，Grok 4 的神话在决赛中轰然崩塌，以 0-4 完败于喋喋不休（chatty）的 o3。

当天，Grok 4 的棋风与往日「判若两人」，频频出现低级失误，而 o3 几乎全程保持冷酷的处刑姿态。

首局较量中，Grok 4 在开局阶段就毫无缘由地白丢了一象。少子劣势下，Grok 4 竟主动寻求兑子，这显然违反了所有棋类典籍中「劣势方应避免简化局面」的黄金法则。

随着接下来的连续失误，Grok 4 被 o3 干净利落地将死。首局失利

_勇士横扫骑士夺冠回放_中美军事对抗结果

第二局上演了西西里防御的「毒兵变例」，这是国际象棋中一种极具攻击性与风险性的开局变例，属于西西里防御的分支，常见于纳依多夫变例中。其核心是黑方故意吃掉白方看似「无保护」的 b2 或 a2 兵（实际是陷阱），从而引发激烈的战术对抗。

如果说 b2 兵对人类棋手是剧毒之物，那么 a2 兵对人工智能而言简直是致命病毒。比赛中，黑棋竟走出 12...Qxa2??，无视白方 c3 马的守护贸然吃兵。此后o3 轻松赢得第二局的胜利

而到了 Grok 4 执白的第三局，本赛事首次出现 AI 采用西西里防御的马罗兹结构。凭借稳健的盘面，Grok 4 似乎要重拾王者风范。难道前两局的溃败只是戏耍对手吗？显然不是。

当白棋走出 11.Nd5?? 并白送一马时，所有幻想随之破灭。紧接着 Grok 4 又接连葬送皇后、车象易位权，最终在第三局满盘皆输

到了决胜局，两个大模型贡献出了系列赛最胶着的一战，甚至一度轮到 o3 自毁长城，它早早因失误白送皇后，局面陷入到了绝境。

但正如解说嘉宾、国际象棋大师中村光所指出的，盘面仍暗藏玄机。此后，o3 触底反弹，与先前的致命失误形成鲜明对比，凭借精妙战术夺回后手。

比赛最终演变为 o3 多一兵的残局，理论上仍可成和。不过，正如此前 Grok 4 手握车兵却无法完成将死所暴露的缺陷，它在残局阶段显然存在致命短板。

相反，o3 展现出更精准的终盘理解力，步步为营完成升变，最终以教科书般的将杀为这场对决画上句号。

中美军事对抗结果__勇士横扫骑士夺冠回放

随着第四局的胜出，o3 成为首届大模型国际象棋对抗赛的冠军，Grok 4 只能屈居亚军。

Gemini 2.5 Pro 摘得季军

谷歌总算「没白来」

季军争夺战在谷歌 Gemini 2.5 Pro 与 OpenAI o4-mini 之间展开，虽然不像决赛结果那样悬殊，却也难称得上称势均力敌。凭借三胜一和的战绩，Gemini 最终摘得铜牌。

不过，Gemini 的统治级表现背后，是全程混乱不堪的对局质量，与冠军 o3 行云流水的棋风相差甚远。首局，Gemini 还能够组织起像样的攻势，让人误以为这个 AI「胸有成竹」。

然而，第三局的平局才真正暴露出这场季军战的本质 ——双方几乎都在梦游，整场对局充斥着业余级的失误

这局棋的胜率曲线如同过山车般剧烈波动，双方频频「互送大礼」，连最简单的胜势都无法把握。

勇士横扫骑士夺冠回放_中美军事对抗结果_

完整对局形势如下所示。尽管这场充满争议的平局暴露出了 Gemini 的不足，但它的整体表现已足够亮眼。

最终，凭借另外三局的胜利，Gemini 2.5 Pro 成功锁定季军席位，不至于让谷歌这个赛事主办方颗粒无收。未来，人们更期待看到谷歌如何利用此次赛事数据来优化其 AI 系统。

原文链接：https://www.chess.com/news/view/kaggle-game-arena-chess-2025-day-3

返回列表

上一篇：叶柯：惨遭“去母留女”掘金梦碎，再现直播间试图换人设捞钱！

下一篇：奇怪！有南京家长竟收到2份录取通知书！

“抵制恶性竞争”，三家外卖平台同日发文，股价大涨！京东：抵制“0元购”！饿了么：不做大规模“0元购”活动；美团：补贴严格遵守法律

8月1日，美团、阿里巴巴盘中拉升，一度大涨超3%，截至发稿，美团涨幅回落至2.22%，阿里巴巴涨2.33%，京东集团涨1.38%。消息面上，8月1日，美团、淘宝闪购及饿了么、京东发文：呼吁抵制无序...

英伟达数十万芯片+亚马逊50亿美元豪赌沙特

5月14日消息，美国政府正酝酿宣布一项面向沙特、阿联酋等中东国家的重要协议，将为该地区提供更广泛获取先进人工智能芯片的渠道。该协议预计将显著提升这些国家从美国科技企业——包括英伟达、AMD、Groq等...

抓住稳就业“牛鼻子”

最新数据显示，今年上半年，全国城镇新增就业695万人，完成全年目标任务的58%，快于时序进度。城镇调查失业率稳步回落，2月份以来，城镇调查失业率逐步下降，6月份降至5%，1月份至6月份均值5.2%，低...

股权薪酬占营收119%：OpenAI为留住人才付出高昂代价

媒体消息显示，OpenAI因应激烈的人工智能（AI）领域人才争夺战而大幅提升员工薪酬，其股权激励成本已达到惊人水平，让现有投资者面临营利性子公司重组后股权进一步被稀释的威胁。据美东时间7月7日周一的...

TTS新传论文带读：“情不自禁的资本主义”（真是对霸总文最牛的解释）

霸总文的答题框架（️️️️️）（一）霸总文的叙事机制与情感逻辑（二）霸总形象的历史谱系与社会隐喻（三）资本逻辑对亲密关系的渗透与重构（四）“残酷的乐观”：幻想与现实的辩证张力论文观点（️️️...

美国要求韩国采取限制中国的措施，外交部回应

美专家：亚洲国家被课税40% 谁搭理鲁比奥那套中国说辞美国总统特朗普宣布对亚洲多国征收高额关税之际，美国国务卿鲁比奥于当地时间10日抵达马来西亚首都吉隆坡，出席第58届东盟外长会议期间举行的高层会谈...

发表评论

客服微信：hnyanshan点击复制并跳转微信

录取吧

4比0横扫Grok 4，o3强势夺冠，首届大模型对抗赛结果出炉

相关文章