世界杯才踢几天，AI预测已经有模型封神，有模型翻车

原创 | Odaily 星球日报（@OdailyChina）

作者 | Asher（@Asher_ 0210）

本届世界杯，最热闹的地方不只在球场上。

随着世界杯相关预测事件热度升温，越来越多用户开始用真金白银参与交易。 谁能赢、几比几、会不会爆冷、有没有红牌、哪名球员能进球，这些原本属于球迷赛前闲聊的话题，如今被拆成了一个个可以交易的预测事件。

而当预测变成交易，用户需要的就不只是情绪和直觉：赔率变化、球队状态、伤病信息、历史交锋、市场情绪，都会成为交易前的参考。在这一过程中， AI 模型开始被频繁拉进世界杯预测场景里。

千问、ChatGPT、Gemini、Claude、DeepSeek、Qwen 以及 Copilot 等大模型，不仅能回答“哪支球队更可能赢”，还能给出比分判断、爆冷可能、红牌风险、关键球员表现和比赛走势分析。对于预测市场参与者来说，AI 的赛前推演，正在成为赔率、新闻、球队数据和市场情绪之外的另一层参考。

不过，预测最终仍要回到比赛本身。

随着世界杯正式开赛，前几场比赛结果已经陆续出炉。那些赛前被用户拿来辅助判断的 AI 分析，也终于有了可以对照的答案： 比分有没有押中，爆冷有没有提前看到，红牌、绝杀、比赛走势这些细节，又有多少真正被模型捕捉到了。

最先出圈的，竟是千问

世界杯首日最有节目效果的，无疑是千问。

揭幕战墨西哥对南非，千问赛前给出的预测是墨西哥 2:0 南非。比赛结束后，比分真的定格在 2:0。更有看点的是，全场一共出现三张红牌，也和千问赛前提到的“南非防守动作过大、可能早早陷入少打一人”的风险判断基本吻合。

如果只是判断墨西哥取胜，这并不算太意外。作为东道主之一，墨西哥本身就更被看好。但千问这次踩中的是更具体的比赛细节： 2:0 的比分、南非的红牌风险，以及比赛中后段被逐渐拉开的节奏。

紧接着，韩国对捷克这场，千问又给出了韩国 2:1 的判断。

这场比赛赛前并不算好猜。捷克有身体对抗，有定位球威胁，也有欧洲球队一贯的大赛经验。比赛过程也确实没有一边倒，捷克先取得领先，韩国随后扳平，比赛一度长时间僵在 1:1。直到最后阶段，韩国打进制胜球，比分最终变成 2:1。

这一下，千问的预测就有了更强的“剧本感”。胜负判断可以靠纸面实力，比分预测可以有运气成分，但红牌、逆转、最后阶段制胜这些过程细节，才真正让人觉得“有点东西”。首日两场之后，千问先把 AI 预测世界杯的关注度拉了起来。

Copilot：有神来一笔，也有明显翻车

赛前，USA Today 曾让 Copilot 预测了本届世界杯全部 104 场比赛。从目前已经结束的比赛来看，这份预测既有高光，也有明显失手。

其中，有三场比赛的预测最亮眼。

揭幕战墨西哥对南非，Copilot 给出的预测是墨西哥 2:0，最终比分正好命中。韩国对捷克，它预测韩国 2:1，同样与赛果一致。到了巴西对摩洛哥，Copilot 又给出 1:1 的判断，结果巴西真的被摩洛哥逼平。

尤其是巴西 1:1 摩洛哥这场，含金量不低。 巴西毕竟是传统豪门，阵容和关注度都在第一梯队。摩洛哥虽然上届世界杯打进四强，但面对巴西，赛前直接预测双方打平，并不是一个特别安全的选择。结果比赛踢完，巴西没有拿下开门红，摩洛哥也延续了自己在大赛中的韧性，Copilot 这场预测确实是“神来一笔”。

但 Copilot 的问题也很快暴露出来。

它预测加拿大 2:1 战胜波黑，结果双方踢成 1:1；预测瑞士 1:0 小胜卡塔尔，结果瑞士同样被逼平；预测美国 2:0 巴拉圭，方向虽然对了，但实际比分是 4:1，进攻强度被明显低估。

更明显的翻车，出现在几场爆冷和强队受阻的比赛里。

土耳其对澳大利亚，Copilot 预测土耳其 2:1 取胜，结果澳大利亚 2:0 爆冷赢球。厄瓜多尔对科特迪瓦，它预测厄瓜多尔 2:1，结果科特迪瓦 1:0 拿下。荷兰对日本，它预测荷兰 2:1，结果日本两度追平，最终双方 2:2 战平。瑞典对突尼斯，它预测 1:1，结果瑞典直接踢出 5:1。

Copilot 能押中墨西哥、韩国、巴西这几场具体比分，说明并不是只会顺着热门队给答案。但澳大利亚击败土耳其、卡塔尔逼平瑞士、日本逼平荷兰这些比赛，也暴露出它对冷门和平局的判断仍然偏保守。

ChatGPT：分析很完整，但冷门抓得不够准

相比 Copilot 的完整赛程预测，ChatGPT 更像是一个“赛前分析型选手”。

在揭幕战预测中，ChatGPT 预测墨西哥 2:0 南非，最终比分命中。 它给出的理由也比较完整，包括墨西哥的主场优势、近期状态、南非进攻乏力，以及墨西哥城高海拔和主场氛围等因素。 这次预测中，ChatGPT 不只是给了结果，背后的判断逻辑也和比赛结果对上了。

但到了对世界杯完整赛程预测里，ChatGPT 的稳定性就没那么强。 虽然它命中了墨西哥 2:0 南非和巴西 1:1 摩洛哥，也看对了苏格兰、德国、瑞典等几场比赛的胜负方向。但在韩国 2:1 捷克、卡塔尔 1:1 瑞士、澳大利亚 2:0 土耳其、日本 2:2 荷兰这些比赛上，ChatGPT 的判断都预测了纸面实力更强的队伍。比如瑞士应该赢卡塔尔，土耳其应该赢澳大利亚，荷兰应该小胜日本。

ChatGPT 不是没有预测能力，它能把球队实力、主场环境、近期状态拆得很清楚，也能在部分比赛里命中比分。但从目前结果看，它更擅长解释“为什么热门队更合理”，而不是提前识别哪些比赛可能偏离热门剧本。

Gemini、Grok、Claude：同一场比赛，不同模型写出不同剧本

除了千问、Copilot 和 ChatGPT，还有一些社媒用户把同一场比赛喂给多个模型做赛前预测。

以揭幕战墨西哥对南非为例，有博主同时测试了 ChatGPT、Gemini、Grok 和 Claude 四款 AI 模型进行赛前预测。结果显示，ChatGPT 和 Gemini 都给出了墨西哥 2:0 南非的预测，最终比分正好命中； Grok 预测墨西哥 2:1，Claude 预测墨西哥 3:1，虽然都看对了墨西哥取胜，但没有押中具体比分。

这次揭幕战的预测，不同模型给出了三种不同的“剧本”。ChatGPT Go 和 Gemini Pro 更接近实际比赛：墨西哥占优，南非进攻乏力，最终被零封。Grok 更像是给了一个相对开放的比分，认为南非会有反击收获。Claude Sonnet 则把墨西哥的进攻预期拉得更高，给出了 3:1 这种更大开大合的结果。

小结

由于目前可回溯的 AI 预测样本仍然有限，现阶段还不能直接判断哪个模型最“懂球”。

但只看已经结束的几场比赛，差异已经开始显现。千问目前最有记忆点，首日连续命中墨西哥 2:0 南非、韩国 2:1 捷克，还踩中了红牌风险和比赛走势，属于小样本里的高光表现。不过，后续能否持续命中，还需要更多比赛验证。

Copilot 和 ChatGPT，两者都有命中具体比分的高光，但也都暴露出一个共同问题——面对澳大利亚击败土耳其、卡塔尔逼平瑞士、日本战平荷兰这类偏离纸面实力的比赛，判断仍然不够敏感。

至于 Gemini、Grok、Claude 等模型，目前公开样本更多集中在单场或社媒对照，参考价值有，但还不适合直接下排名。

AI 已经可以成为世界杯预测市场用户的一层参考，但还远不是标准答案。接下来，Odaily星球日报也会继续收集各模型赛前预测，并随着比赛推进持续回看：哪些模型只是开局运气好，哪些模型真的能在更多场次里经得起赛果检验。

世界杯才踢几天，AI预测已经有模型封神，有模型翻车

最先出圈的，竟是千问

Copilot：有神来一笔，也有明显翻车

ChatGPT：分析很完整，但冷门抓得不够准

Gemini、Grok、Claude：同一场比赛，不同模型写出不同剧本

小结

New CLARITY Act Draft Adds Sunset Ethics Ban on Trump's Crypto Ties, But Democrats Aren't Sold

Top Public Companies Hold Over $79B in Bitcoin, Strategy Leads

KuCoin Scores a Celestia Stage at Tomorrowland, but Trust Issues Still Cast a Shadow