震惊！Fable 5发布，Skill和Prompt难道要成历史？

2026-06-15 15:18:33未知作者:徽声在线

亨利发自徽声在线科技频道
量子位 | 公众号 QbitAI

Workflow、Skill、SOP，这些曾经被视为AI应用领域不可或缺的“法宝”，如今似乎正面临被淘汰的命运。

Fable 5发布仅24小时，Reddit上的资深用户Bohdanowicz便熬夜体验，最终给出了这样的评价：

“工作流的变革，远超模型本身的升级。而模型技术的飞跃，也是实实在在的。”

在过去的几个月里，Bohdanowicz为了提升模型的使用效率，精心构建了一套详尽的工作流，将任务拆解得井井有条，甚至亲手编写了Harness工具。然而，Fable 5的发布，让这一切努力显得有些多余。

用他的话来说，是时候重新规划策略了！人类精心设计的Agent工作流，在Fable 5面前，已经显得力不从心。

以往需要分4到6步、全程监控的任务，现在只需一句话，Fable 5便能自主完成。

可以说，几个月积累的经验和技巧，在Fable 5面前瞬间变得黯淡无光。

（看来，学再多技巧，也抵不过技术的飞速发展！）

而有这种感受的，远不止Bohdanowicz一人。

Fable发布72小时后，网络上涌现出一批深度体验报告，大家讨论的焦点集中在同一个问题上：在AI时代，人与模型该如何重新分工？

除了Bohdanowicz，几位知名人士的体验报告也广为流传，他们的体验画风是这样的：

Simon Willison（Django联合创始人）：离开电脑去处理家务，回来时发现Firefox浏览器竟然在自动运行。为了修复一个2行CSS的bug，Fable 5竟然自主发明了一套浏览器自动化工具。
Ethan Mollick（沃顿商学院教授）：想要一张1881年风格的全球旅行时间地图，Fable 5不仅自主查询了2200多条航班信息，还找到了前往太平洋小岛的船期。
Matt Van Horn（开发者）：整理了865条全网讨论，形成了一份生存指南，发现社区风向已变：直接给模型设定目标，别再纠结于提示词和SOP了。

两行CSS，竟激发了模型的自动化潜能

先说说Django联合创始人Simon Willison使用Fable 5的体验。

两天体验下来，Simon最大的感受是Fable 5的“relentless proactive”（不懈的主动），简单来说，就是Fable 5特别爱主动找事做。

事情是这样的。

6月11日，Simon在自己的项目中发现了一个小bug，输入框下方多出了一条不应出现的横向滚动条。

他截了张图，丢给Claude Code中的Fable 5，只留下一句提示：“去依赖库里查查原因。”然后便起身去做家务了。

几分钟后回来，他愣住了。Firefox浏览器竟然自己打开了，正在自动跳转到出bug的页面。

接着，Safari也打开了，而Simon从未安装过任何浏览器自动化工具。

事后查看日志，Simon发现Fable 5做了一件非常惊人的事情：为了修复这个bug，它自主构建了一套自动化工具链。

具体来说，Fable 5先启动了本地服务，在不同浏览器中复现问题。

发现无法复现后，它直接打开了Simon真实机器上的浏览器。

为了看清页面，它绕过常规方案，使用Python调用macOS底层接口进行窗口截图。

遇到弹窗无法打开的问题时，它直接修改了网页模板，模拟按键操作。

当无法获取页面尺寸时，它顺手搭建了一个本地服务器，将浏览器中的数据回传回来。

整个过程中，没有人告诉它该怎么做。它只是一步步发现缺失什么，就补充什么。

最终，修复方案出炉：

两行CSS代码。

这中间还有个小插曲。在探索完所有方法后，Fable 5触发了某个未知的限制，被自动降级为Opus 4.8。

但好在Opus拿着完整的对话记录，沿用了Fable 5发明的所有技巧，完成了修复。相当于一个模型为另一个模型留下了施工图纸。

Simon将这种行为命名为“relentlessly proactive”，即不依不饶地主动。

Fable 5掌握的技巧极多，为了达成目标，几乎愿意尝试任何方法，完全无需人类介入指导。

一个提示词，模型自主工作了九个半小时

接下来是沃顿商学院教授Ethan Mollick的体验。

先说结论。

在他看来，Fable 5相比之前的所有模型都是一次巨大的飞跃。而真正发生变化的，不仅仅是能力，更是人与AI之间的关系。

拿到模型后，Mollick先提出了一个老问题——等时线地图。

这是一类诞生于19世纪的地图，展示从某座城市出发，经过多少天能够抵达世界哪些地方。

虽然看似只是生成一张地图，但背后需要整合海量交通数据，并做出无数细微判断。

过去，他曾用这个题目考验过不少模型，没有一个能够真正过关。

而这一次，他只给了Fable 5一个超长提示词：

我希望你构建一张经过完整研究且美观的等时线地图，让我能够选择不同的城市，并基于真实数据看到真实的等时线。我希望设计独特。你应该考虑机场（以及往返机场的交通时间）、火车、步行和开车。数据不必是实时的，但应基于你的研究和数据是真实的。你可以从几个城市开始，但越通用越好，这应该是一个全新的项目。

（大家也可以尝试一下）

并接受了Fable 5按照原始地图风格实现的建议，然后奇迹发生了：

Fable 5接到提示词后，先启动了子Agent（可能是sonnet这样的低成本模型）进行研究，检索了超过2200条航班数据，从法国TGV到日本新干线的时刻表，再到不同国家的公路通行速度。

与此同时，它自己编写代码、验证结果、记录进度。

Mollick后来提出了一条意见：偏远地区不要估算，要使用真实数据。

于是，模型又启动了一套互相挑错的Agent流程，一组负责查资料，一组负责找漏洞。

从太平洋上的皮特凯恩岛补给船班次，到加拿大北极圈内小镇Grise Fiord的交通路线，全被一一找出。

最终结果是一个可以互动的地图，你拖动鼠标到哪里，就会显示到达那里需要多久。

（注：地图链接：
https://isochronic-passage-chart.netlify.app/#nyc）

而真正让Mollick震惊的，还不只是这张地图。后来，他又将一个研究界的老难题抛给了Fable 5：

如何校准人类评分员与AI评判之间的差异，这是一个让很多研究者都头疼的问题。

模型接到任务后，先写出了一份19页的设计文档，然后开始工作。

九个半小时后，它交出了一套完整的软件工具：Concord。

Mollick后来将其开源到了GitHub。

作为领域专家，他当然还是挑出了一些问题，让模型继续修改。但整个过程中，他最强烈的感受却是：自己越来越无事可做了。

数百个技术决策，模型直接替他做了，过程长到甚至不值得他去跟踪。

于是，Mollick写下了一句意味深长的话：

“欢喜，因为我只是提了个要求，事情就成了。

“不安，也因为我只是提了个要求，事情就成了。”

去年，他还将使用AI形容为当巫师，念出咒语，然后等待奇迹发生。

但这一次，他改口了。“我已经不确定自己还是不是那个巫师。我更像一个甲方，描述需求，付钱，验收。至于炼金术发生在哪里，我已经看不见了。”

Fable 5最先淘汰的，是提示词工程师吗？

如果说前面两位讲的还是个人体验，那么开发者大佬Matt Van Horn则替大家做了一次社区普查。

他从Reddit、X、YouTube一路爬到TikTok，阅读了865条关于Fable 5的讨论，最后整理出了一份《第一天生存指南》。

当然，这865条讨论中不乏一些搞笑的内容。

有人刚拿到号称“Mythos级”的新模型，就让它写待办清单和贪吃蛇游戏代码。

在常年仰望AGI的r/singularity版面上，一个高赞帖子更是直接宣布：

“兄弟们，我觉得我们摸到AGI的门槛了。”

但剔除这些段子后，社区其实很快形成了一些共识。

比如，Fable只负责规划，让同门但成本更低的Sonnet编写实现代码，更便宜的Haiku运行测试，一半Agent负责干活，一半Agent负责验收，只有验收通过才允许提交代码。

与此同时，网上也出现了一些“邪修”版本，直接将Fable 5设置为最大努力程度，然后让它作为协调者管理Opus等模型。

还有开发者发现，Fable开中等思考强度时，效果甚至好过Opus 4.8全力以赴，而且消耗的Token更少。

但整份指南中排在第一条的结论，却绕了一大圈互联网后，又回到了文章开头的Bohdanowicz身上。

给模型设定目标，而不是步骤。

这是什么意思呢？过去大家写提示词时，喜欢把任务拆解得明明白白，生怕模型理解错，Skill、SOP都是这套方法的衍生品。

但如今，越来越多的开发者发现，这套方法开始失效了。

连Anthropic自己也在调整工作方式。Claude Code团队成员Thariq形容，这是从微观管理任务转向高层目标对齐。

翻译一下就是：旧时代的Prompt Skill是在教AI如何做事，新时代的Prompt Skill是在告诉AI什么叫做做好这件事。

而Bohdanowicz正是对此感受最深的人。

他原来的工作流极其严格：调研、规划、实现、测试，每一步都单独下指令。

但换成Fable 5后，他发现这套脚手架不仅没有帮助，反而成了负担。

因为模型本身就在规划，额外塞进去的人类流程反而会限制它判断任务边界。

于是他总结出了一句被广泛转发的话：

“别再规定如何（How）做，只规定做什么（What）以及什么算完成。”

这里有个容易误解的地方。这并不意味着提示词不重要了。恰恰相反，机器能够验证的验收标准依然是人类最有价值的输入。

真正过时的，是那些手把手教模型做事的过程说明书。

帖子里他还提到了一个此前很少被讨论的能力：

爆炸半径分析（Blast Radius Analysis）。

Fable在修改一段代码之前，会先梳理上下游依赖关系，然后派出对抗Agent专门挑战那些隐藏假设，而类似机制Bohdanowicz过去是自己手工搭建的。

“看到它自主生长出这种能力时，我彻底服了。”

几个月搭建出来的工作流，一夜之间成了负资产。

One More Thing

Matt Van Horn那份生存指南的文末有一行小字。

这篇关于Fable 5的文章，是在Fable 5的协助下完成的。它没有触发自己的安全分类器。

第一天，一切正常。

我们不知道未来的SOTA模型是否会彻底取代那些由人类总结出来的Workflow、Skill和SOP。

但至少在这一周里，很多开发者已经发现：

自己研究了几个月的提示词技巧，可能还不如模型一晚上悟出来的新方法好用。

AI时代最残酷的事情，或许不是学不会。

而是刚学会，就自动化了。

[1]https://simonwillison.net/2026/Jun/11/fable-is-relentlessly-proactive/
[2]https://digg.com/tech/zrppa6ui
[3]https://www.oneusefulthing.org/p/what-it-feels-like-to-work-with-mythos

点击展开全文