观世界杯淘汰赛有感：我对大模型竞争格局的深度剖析

2026-07-02 23:05:16未知作者:徽声在线

今日凌晨一点多，当英格兰队在下半场60多分钟时仍落后于刚果（金）队，我们世界杯观赛群里的朋友们已经开始严肃探讨起“图赫尔是否应该下课”以及“英国足球流氓可能引发的骚乱”等话题。然而，随着凯恩犹如天神下凡般攻入一球，讨论风向瞬间转变，大家开始猜测“能否在90分钟内结束战斗，避免加时赛”。有懂球的朋友分析，刚果（金）的防线坚如磐石，防守意志坚定，看来比赛很可能要拖到120分钟才能分出胜负。

紧接着，凯恩再次展现神勇，英格兰队涉险过关。巧合的是，两次助攻都来自刚换上场的戈登。图赫尔的命运因此急转直下，从下课边缘瞬间跃至封神边缘，仿佛从股票市场的跌停板被猛然拉至涨停板。但公正地说，决定比赛胜负的关键因素其实很简单：巨星的个人能力。

前日姆巴佩的梅开二度，以及哈兰德的精彩进球，都印证了这一点。严格来讲，巴西对阵日本的那场比赛，维尼修斯也发挥了类似的作用：尽管他未能破门得分，但每次冲入日本队防守三区都能引发一阵混乱，充分展现了个人能力的绝对优势。日本队缺乏巨星坐镇，即便守进加时赛，胜算也微乎其微——这一点我们必须承认。

世界杯淘汰赛，一场定乾坤，90至120分钟后，一支队伍继续前行，另一支则黯然离场。在这种场合下，仅有团队精神是远远不够的，必须依赖超级巨星的灵光一闪。这不禁让我想起了电影《点球成金》(Moneyball)，男主角凭借数据分析在常规赛中屡创佳绩，但到了季后赛却始终无法捧起冠军奖杯。电影给出了答案：

最优秀的球员总是伴随着溢价，依靠数据分析寻找性价比高的球员，意味着你的每个位置都无法达到顶尖水平。优秀与顶尖之间，存在着难以逾越的鸿沟。
在淘汰赛中，你必须具备战胜任何对手的实力，关键时刻必须依赖球星的“硬解”能力。这种能力异常昂贵，没有任何性价比高的替代品。

我尤为喜爱《最后之舞》(The Last Dance)这部纪录片，其中整整一集都聚焦于1998年NBA总决赛的第六场——乔丹的封神之战。皮蓬开场即受伤，主场作战的爵士队士气高昂，乔丹下半场体力不支，多次投射偏短，只能依靠突破和罚球得分。然而，在最后时刻，乔丹在自己多次投失的区域拔地而起，一记绝杀，为公牛队赢得了第六个总冠军。

爵士队输了，这公平吗？显然不。但这就是乔丹的价值，他年薪3000万美元，球队必须围绕他来建队。马龙和斯托克顿无疑是伟大的球员，但凡人与篮球之神之间确实存在难以逾越的差距，这种不讲道理的“硬解”能力就是最大的差距所在。

说了这么多竞技体育的话题，这跟大模型又有什么关系呢？其实关系重大。近日，我在徽声在线上看到多篇批评Anthropic的文章，甚至有人直指其为“邪恶势力”。Anthropic的定价高昂、客服不佳、对某些国家用户不友好，新模型还不让使用，种种问题引发了广泛不满。使用Claude越频繁，对它的开发商就越是容易心生不满，迫切期待有人能取而代之。

DeepSeek V4、Kimi K2.5、GLM 5.2等模型诞生时，均被AI开发者社区誉为“Claude杀手”。这不仅彰显了它们的实力，也反映了Anthropic的不得人心。即便是提价后的DeepSeek，其API价格也仅为Claude的一个零头。作为一个普通的Claude Pro用户，我最痛苦的就是模型额度消耗过快，即便不编程、仅做文本分析，也如同沙漠中的降雨般稀少。

若非Claude实力太过强大，我怀疑世界上不会有人愿意使用它。这句话既是真话也是废话，我们还可以这样表述：

若非凯恩实力超群，不会有人在他29岁时斥资1亿欧元引进他；
若非姆巴佩实力出众，不会到哪个球队都能成为“总监”，掌控更衣室运作；
若非梅西实力非凡，2022年阿根廷怎能夺冠？
若非哈兰德实力强劲，挪威在世界杯淘汰赛中赢球恐怕只是痴人说梦。

我是GPT的重度用户，拥有27个月不间断的付费历史；但即便如此，我也从两个月前开始转投Claude（尽管仍保留了GPT Plus）。因为有些任务只有Claude能够完成，准确地说，只有Claude Opus 4.7/4.8（再加上刚刚恢复使用的Fable 5）能够胜任。GPT总是差那么一点点意思，至于其他模型，我就不多说了。

除了公认的编程和Agent能力外，对于复杂的长文本如小说、剧本、哲学著作、非虚构作品等，Claude给出的语义分析答案也是最佳。从前GPT曾是佼佼者（尤其是GPT 4o时代），但最近半年它逐渐落后于Claude的进步速度。一些言外之意只有Claude Opus能够洞察。我还想强调一点：Opus对于“互文”现象，即文本之间的互相引用、化用、戏仿等，有着极高的识别准确率，几乎达到了相关文科专业博士生的水平，而且它只需几秒钟就能完成分析，而非几天。

那么，更便宜的模型能用吗？当然能用。

更便宜的模型有用吗？当然有用。

更便宜的模型方便吗？当然方便，至少不会像Anthropic那样傲慢无礼、看谁都不顺眼。

但更便宜的模型能完成任务吗？这个问题就复杂了，得看是什么任务……

莱万离队后，舒波莫廷曾在拜仁大放异彩，但为何拜仁还要引进凯恩？是舒波莫廷没有用吗？还是他不够便宜、性价比不够高？

阿森纳斥资1亿英镑引进赖斯，是因为这个世界上没有高性价比的后腰了吗？这个夏天，似乎所有英超豪门都在以1亿英镑争夺安德森，是大家都疯了吗？价值3000-5000万英镑的后腰难道不好用吗？

还有在拜仁刚打了两个赛季好球的奥利塞，为何皇马突然愿意出价2亿欧元求购？如果拜仁愿意出售，相信愿意以类似价格买入的绝不止皇马一家。

答案从来不在数据分析表上，而在球场上。今日凌晨凯恩的两个进球、昨日奥利塞的两次助攻以及赖斯和安德森在球场上的全能表现都证明他们就是关键时刻具备“硬解”能力的球星。别忘了本届欧冠中赖斯对阵皇马时单场攻入两粒任意球的壮举，这种不讲道理的“硬解”能力值不值1亿英镑？

因此即便Anthropic再怎么“邪恶”、再怎么傲慢无礼，大家也只能忍气吞声地继续使用它。今天早上Claude Fable 5刚恢复使用我就迫不及待地消耗了一波模型额度。除非GPT-5.6全面发布且水平大幅提升否则我认为今年之内我最重要的生产力+生活辅助双料工具仍将是Claude。因为我不养龙虾、没有多少日常Agentic Worflow任务所以更便宜的大模型API对我用处不大我还是得忍痛给Anthropic送钱。

附带提一句，在对Gemini失去信任一个多月后我再次成为了Google AI的付费用户唯一原因是Nano Banana Pro的生图能力。我对比了GPT Image-2和Nano Banana Pro认为前者在很多方面都很强大但比后者还是稍逊一筹。我希望生成国风或日漫二次元风格的人设和场景图片不知道为什么GPT在这方面比较拙劣。几乎所有专业AI漫剧公司的主力生图模型都是Nano Banana Pro不是因为其他模型没有用而是因为都不能稳定地达到最高要求。

现在最尴尬的反而是OpenAI。据说Sam Altman决定推迟IPO的原因在于难以保证获得1万亿美元以上的估值。那么问题来了Anthropic上一轮融资的估值已经是9620亿美元离1万亿只有一步之遥为何早在今年年初就达到8600亿美元估值的OpenAI不能更进一步呢？

因为GPT已不再是“最优秀的模型”而只是“优秀的模型之一”。在文本任务和coding方面它比Claude略逊一筹在多模态方面显然打不过Gemini（以及Seedance）。这就好比一个球员的定位不是“超级巨星”不具备无条件“硬解”能力只是“合格的一流球员”——实际能力可能只有5-10%的差距但这就是天与地的区别。

因为最强的模型具备定价权整个市场的大部分利润将注定被它吞噬。竞争对手可以走性价比路线但严格地说这种路线不会对“最强的模型”形成实质性竞争就像球队里的轮换球员不会对超级巨星形成竞争一样。要拿到超级巨星的薪酬只有一条路：在实力上达到超级巨星的水平也就是具备“硬解”能力。

好像所有人都不喜欢姆巴佩但他在世界杯上就是能进球而奥利塞就是能给他喂球所以这两人就高居巨星身价榜的前列。等到有一天姆巴佩不能进球了或者进球也改变不了命运了那不用任何人骂他自己会从神坛上走下来。在皇马其实有点这个意思不过还早。

底线是：即便姆巴佩走下神坛了替换他的肯定是另一个身价1亿乃至2亿欧元的超级前锋而不会是好几个身价3000万欧元的前锋之和。皇马用何塞卢、拜仁用舒波莫廷都是权宜之计否则球迷会造反球队也不可能维持最高水平的竞争力。

点击展开全文