Claude Fable 5四日惊魂:从封神到封禁的AI闹剧

2026-06-15 12:14:54未知 作者:徽声在线



编辑|徽声在线编辑部

从备受瞩目的「AI 里程碑时刻」,到美国政府一纸禁令强制下架——这款名字中带 5 的模型,生命历程竟未超过 5 天。

让我们先暂停脚步,细品这场闹剧的荒诞色彩。

2026 年 6 月 9 日,Anthropic 正式推出其最强模型 Claude Fable 5。当日,开发者社区陷入狂欢,评测文章在各大技术平台刷屏,有人盛赞其「碾压所有竞品」,有人断言「AI 技术天花板被重新定义」。这个此前仅向五六家机构开放的 Mythos 系列模型家族,终于向公众掀开神秘面纱的一角。

然而,仅仅四天后,这扇刚开启的门就被重重关上。

6 月 12 日,美国商务部长霍华德・卢特尼克(Howard Lutnick)致信 Anthropic CEO 达里奥・阿莫代伊(Dario Amodei),以「国家安全」为由,禁止 Fable 5 和 Mythos 5 向任何外国公民开放访问——无论其身处美国境内还是境外,甚至包括 Anthropic 内部的外籍员工。美东时间下午 5 点 21 分,Anthropic 收到这纸指令。

当晚,Fable 5 在全球范围内全面下架。



四天。96 小时。一场从巅峰到谷底的极速坠落。

第一天:神话诞生

Fable 一词源自拉丁语 fabula,意为「被讲述的故事」,与希腊语 mythos 同源。Anthropic 在命名上颇具深意:Mythos 系列是专为少数精英打造的「神话」,Fable 则是面向大众的「故事」。

6 月 9 日,Anthropic 发布 Claude Fable 5,这是 Mythos 模型的首个公开版本。公司宣称其在软件工程、知识工作和视觉领域表现卓越,但附带严格的安全限制。与此同时,Anthropic 还推出了一款「孪生产品」:Claude Mythos 5——与 Fable 5 使用相同底层模型,但移除了网络安全领域的安全过滤层,仅供经过审查的网络防御者和关键基础设施运营商使用。Anthropic 称 Mythos 5 是「全球最强的网络安全模型」。

通俗来讲:Mythos 5 是装满子弹的武器,Fable 5 是同款枪,但出厂时自带保险装置。



从 API 定价来看,Fable 5 的能力在 Anthropic 公开发布的模型中首屈一指,价格约为 Claude Mythos Preview 的一半以下。在订阅计划上,直到 6 月 22 日,Fable 5 将在 Pro、Max、Team 和 Enterprise 等付费套餐中免费提供。

科技圈的赞誉如潮水般涌来。沃顿商学院副教授 Ethan Mollick 在博客中写道,Fable 5「在我用过的所有公开模型中,以相当大的差距超越了其他所有模型」。前 OpenAI 联合创始人、特斯拉 AI 总监 Andrej Karpathy(他上个月刚宣布加入 Anthropic)在社交平台称 Fable 5 是一次「超级令人兴奋的发布」,是「值得大版本号升级的跨越式进步」。

这一天,Anthropic 的 Mythos 神话,似乎真的照进了现实。

第二天:「暗中降智」风波

好景不长。发布仅 24 小时后,一场风暴在 AI 社区悄然酝酿。

起因是一份 319 页的安全说明书(System Card)。

争议的焦点集中在说明书中的一个隐藏段落。Anthropic 并未主动披露这一细节:Fable 5 在检测到与前沿 AI 开发相关的请求时,会悄悄降低回答质量——包括训练大型模型所需的基础设施搭建工作。

更关键的是操作方式:模型仍会作出回应,但会采取「干预措施来限制 Claude 的有效性」,且不会告知用户。这与 Fable 5 的其他限制不同。当模型屏蔽网络安全或生物学查询时,会明显地将用户重定向到功能较弱的 Claude Opus 4.8,并有通知提示。

换句话说:你问它 AI 训练相关的问题,它会回答你——但悄悄给你一个打了折扣的答案,而且不告诉你它在这样做。

这种操作,被迅速冠以一个传播力极强的名字:「暗中使坏」(Secret Sabotage)。

美国创新基金会高级研究员、前白宫科技政策办公室顾问 Dean Ball 为这一事件命名,并写道,这一政策「极大地、深刻地提升了『AI 安全一直是实验室垄断行为的借口』这一论点的说服力」。Fast AI 非营利研究机构负责人 Jeremy Howard 则指出了其中的不对称性:Anthropic 为自己的研究人员保留了完整的 Fable 5 能力,却在对外部研究者的访问上设了枷锁。「他们已经说明了,凡是想要效仿的,都会被他们破坏,」Howard 写道。

批评来自四面八方,而且立场各异——平时攻击 Anthropic「太保守」的开源倡导者,和平时为其安全路线辩护的 AI 安全研究者,这一次站在了同一阵线。

加入 Anthropic 仅一个月的 Andrej Karpathy 措辞谨慎:模型「仍然有一些人会遇到的奇怪之处」,安全过滤器「配置得有点过于敏感」,但希望随时间改善。算是打了圆场,又没全力护盘。

Anthropic 也很快感受到了压力的量级。一位发言人告诉《财富》杂志:「我们做出了错误的权衡,对于没有取得正确的平衡,我们深表歉意。」随后,隐性能力限制被移除。



承认失误、道歉、回滚…… 这在科技大厂里已属难得的姿态。但麻烦,才刚刚开始。

第三天:微软「背刺」与数据留存争议

就在「暗中降智」风波渐渐平息之际,另一颗雷悄悄引爆了。

微软以数据保护问题为由,对员工使用 Claude Fable 5 实施了临时禁令。

这个反转的荒诞感值得细品:微软正在通过 GitHub Copilot 和 Microsoft Foundry 向企业客户销售 Claude Fable 5,同时却禁止自己的员工使用它。对外卖,对内禁,这句话用来描述一家公司对同一款产品的态度,实在是有些奇特。



问题出在数据留存政策上。Anthropic 要求对 Mythos 系列模型(包括 Fable 5)的提示词和输出内容至少保留 30 天,用于安全监控。这与微软此前与 Anthropic 签订的企业零数据留存协议相抵触。Anthropic 同时规定,被其安全系统标记的内容可被保留最长两年,用于调查或执法目的。

对于一家把「保护客户数据」视为核心承诺的企业来说,员工用 Fable 5 处理商业机密时,这些内容原则上可以在 Anthropic 的服务器上存放长达两年——这在法律层面是一个真实的风险敞口。

这场尴尬揭示了一个更深层的矛盾:在企业 AI 采购中,模型能力、安全架构和数据治理,已经无法再被分开考量。

与此同时,安全社区在发布后最初数日里也开始记录另一个问题:Fable 5 对许多合法的红队测试(Red Team)和学术安全工作流程也触发了拒绝,这些请求与 Opus 4.8 在标准策略下会处理的内容并无二致。Anthropic 在给普通用户关上漏洞的同时,也把正规军堵在了门外。

第三天结束时,Fable 5 的处境颇为微妙:「暗中降智」已经撤回,但数据政策引发的企业端信任裂缝还没有修复,安全过滤的误伤率仍被研究人员抱怨。这个模型像一个刚刚公演的演员,首演就被人挑出了三处穿帮。

第四天:政府出手,神话落幕

6 月 12 日,周五下午。

美国商务部长霍华德・卢特尼克向 Anthropic CEO 达里奥・阿莫代伊发出一封信,表示 Mythos 5 和 Fable 5 将受到出口管制,范围涵盖美国境外的任何地点,以及境内的所有外国公民。

Anthropic 当晚收到指令的时间是美东时间下午 5 点 21 分。信中并未提供具体的国家安全关切细节。

据 Axios 报道,该行政官员表示,商务部是在另一家公司声称成功「越狱」Mythos 后决定采取行动的,这让特朗普政府对潜在的国家安全风险产生了警觉。

所谓「越狱」(Jailbreak),是指通过特殊提示绕过模型的安全限制,让它吐出本该被过滤的内容。如果有人能绕过 Fable 5 的安全层,理论上就能访问到底层 Mythos 模型的完整网络安全能力——那是 Anthropic 自称「全球最强网络安全 AI」的东西。

Anthropic 随即作出回应,语气里藏着明显的委屈:我们审查了这一特定技术的演示,其被用于识别少量此前已知的微小漏洞。这些漏洞看起来都相对简单,我们发现其他公开可用的模型也能在没有越狱的情况下发现它们。

换句话说,Anthropic 的意思是:你说的这个「越狱」,用其他普通模型也能复现,凭什么单独封杀我?

Anthropic 还指出,政府所援引的越狱方式只能在单一特定情形下解锁 Mythos 的部分网络安全能力,而非能够全面绕过所有防护的通用型越狱方法。Anthropic 还表示,同样的越狱方式也可以被用于包括 OpenAI 的 GPT-5.5 在内的其他公开可用模型,而这些模型并未受到类似的出口管制。「我们不同意,发现一个局部的潜在越狱方法,应该成为召回一款已向数亿人部署的商业模型的理由。」Anthropic 在博客中写道。



然而,争论是没有意义的。命令已经到达。

Anthropic 选择全面关闭 Fable 5 和 Mythos 5 的访问权限,原因是若要选择性合规,则需要屏蔽大量用户——其中包括 Anthropic 自己的外籍员工。

深夜,全球用户打开 Claude,发现 Fable 5 从模型列表里消失了。

幕后:远不止是一场技术事故

如果你以为这只是一场普通的「新模型发布翻车」,那你可能漏掉了更深层的剧本。

这场风波的背后,是 Anthropic 与特朗普政府之间一段持续数月的对抗关系。2026 年 2 月,五角大楼与 Anthropic 的谈判破裂:Anthropic 拒绝允许 Claude 被用于致命自主武器或大规模平民监控,并为此付出了代价——被贴上「供应链风险」标签。历史上,这个标签通常只用于外国对手,要求国防承包商在与军方合作时承诺不使用 Anthropic 的 Claude 模型。

此后,Anthropic 对特朗普政府提起诉讼,以寻求推翻这一封禁,诉讼至今仍在进行中。

时间线至此变得耐人寻味:合同谈判破裂在 2 月,黑名单来了;Anthropic 起诉政府,法院暂时阻止了黑名单执行;Fable 5 在 6 月上线,三天后,出口管制指令到达。

出口管制指令,就在 Anthropic 已经与政府在法庭上交锋的同一周发出。

更具戏剧性的是 Anthropic 那份透明度的反噬。Anthropic 在发布前公开承认,任何模型的完美越狱抵抗都是不可能实现的——这是一种出于善意的透明表态。但政府似乎正是以这一承认为框架,为其担忧找到了依据。如果透明承认自身局限会招来监管行动,而不透明则不会,那么行业将会得出相应结论。结果是公众获得的 AI 能力和风险信息将会减少——这与安全倡导者多年来的追求恰恰相反。

说白了:你越诚实,越可能被人抓住把柄。

结语:Fable 的故事,昙花一现

Fable,那个来自拉丁语「被讲述的故事」。

这四天里,Fable 5 确实被讲述了。只是没人料到,它自己才是这个故事里最短命的主角。

96 小时内,它完成了一次令人叹为观止的「成就解锁」:

发布日万众瞩目,当天被誉为 AI 史上最强公开模型;第二天被曝「暗中降智」,Anthropic 连夜道歉撤回;第三天微软宣布内部禁用,数据政策掀起企业端信任危机;第四天,美国政府一纸令下,全球强制下线。

这是一个在封神和封禁之间,只隔了四天的故事。

Anthropic 目前正在争取尽快恢复访问。该公司表示认为存在误解,并正努力尽快恢复访问。它同时对 Fable 5 的安全防护架构保持信心,并指出没有任何测试者发现能够广泛绕过模型防护的通用越狱方法。

但「Fable 5 重新上线」的那个故事,暂时还没有被讲述。

更深层的问题也悬而未决:当一个公司将自己最强大的产品公开发布,政府可以在 72 小时内以「国家安全」为由将其全球下线——这条权力边界,今后每一家 AI 公司都必须纳入自己的发布风险模型。未来的 AI 发布,不只是技术问题,也是地缘政治问题。

而 Fable 这个词的另一层含义,不应被遗忘:它也可以指「寓言」—— 一个带有道德教训的虚构故事。

这一次的教训是什么,就留给读者自己去判断了。

点击展开全文
你关注的
从“几年一遇”到“一年几遇”,AI时代网络攻防失衡加剧 奇安信齐向东:主战场转向制造业与服务业从“几年一遇”到“一年几遇”,AI时代网络攻防失衡加剧 奇安信齐向东:主战场转向制造业与服务业 微信电脑端重大更新:可滚动截长图与支持发语音功能上线微信电脑端重大更新:可滚动截长图与支持发语音功能上线 上海布局太空算力新赛道,全球首颗光计算卫星研制正式启动上海布局太空算力新赛道,全球首颗光计算卫星研制正式启动
相关文章
Claude Fable 5四日惊魂:从封神到封禁的AI闹剧Claude Fable 5四日惊魂:从封神到封禁的AI闹剧 亚马逊“举报”Anthropic引震动 两大AI模型全球下架风波亚马逊“举报”Anthropic引震动 两大AI模型全球下架风波 18.42万亿Token!中国AI大模型周调用量七周蝉联榜首:MiniMax M3跃居次席,DeepSeek V3.2半年首度落榜18.42万亿Token!中国AI大模型周调用量七周蝉联榜首:MiniMax M3跃居次席,DeepSeek V3.2半年首度落榜 分析师借AI写研报闹乌龙,互联网信息净化迫在眉睫分析师借AI写研报闹乌龙,互联网信息净化迫在眉睫 蔚来李斌警示:中国汽车行业决赛阶段竞争残酷,销量或下滑15%-20%蔚来李斌警示:中国汽车行业决赛阶段竞争残酷,销量或下滑15%-20% 美国防部再揭UFO神秘面纱!第三批文件曝光:美军士兵目击土豆状物体,鱼鳞纹外观2分钟内骤然消失美国防部再揭UFO神秘面纱!第三批文件曝光:美军士兵目击土豆状物体,鱼鳞纹外观2分钟内骤然消失