最强模型 Fable 5，开始不让你随便用了

曹犟

发布于 2026-06-11 19:37:52

2770

你好，我是曹犟，欢迎关注我的公众号！

6 月 9 日，Anthropic 发布了新模型 Fable 5。

我是 Claude Code 的资深用户，整个工作流都是构建在其基础之上，这篇文章的很多信息收集和事实核查也正是用 Fable 5 完成的；我做的产品 Omni-Growth 也在大量使用 Anthropic 的 API。所以，我也注意到，Fable 5 这次出来之后，大家关于它的能力的讨论少了很多，而是都在讨论 Anthropic 这次的各种“骚操作”。

例如，有些媒体会说：“Anthropic 会把请求偷偷转给一个更弱的模型？”当然，Fable 自己对照官方文档查完后，回答得很老实：转是会转，但并不偷偷，API 会明确告诉你请求被哪个分类器拦下了，要不要转给别的模型，甚至由你自己决定；但是真正没有任何提示的，反而是另一件事。

这个回答让我写篇文章讨论这个事情，在我看来，它背后的变化，比“Anthropic 的新模型榜单刷了多少分”有意思得多。

一、Fable 5 的三个不寻常设定

过去预热了很久的 Mythos，是 Anthropic 内部最强的模型层级，只通过邀请制的 Project Glasswing 计划向少数获批组织提供。而这次发布的 Fable 5，其实就是它加上安全分类器之后的公开版，人人可用；Mythos 5 不带安全分类器，仍然只向获批组织限量开放。

同一个模型，两条供给通道，有三个有趣的设定。

第一个设定，高风险请求拦截与转接。当系统识别出请求涉及网络安全、生物化学或者模型蒸馏（Anthropic 在 X 上曾经炮轰过很多中国同行的蒸馏行为）时，请求会被安全分类器拦下，据说触发率平均不到 5%。在 Claude 官方应用里，这类请求会自动交给 Opus 4.8 回答，并告知用户；在 API 里做得更彻底：返回一个标准的拒绝响应，标明是哪个分类器拦截的，由调用方用一个显式参数自己决定是否转交给其它模型处理。被拒绝的请求不计费，转接重试还有专门的补偿机制，不让你为切换模型重复支付缓存成本。

第二个设定，强制 30 天数据留存。Fable 5 和 Mythos 5 的所有流量都会被 Anthropic 留存 30 天，用于安全审查。与之相对的，Anthropic 的其它模型则可以签零留存协议。更关键的是，企业原来签好的零留存协议，对这两个模型不适用，而且没有任何谈判空间。

第三个设定，某些领域的能力被有意控制了。已经有开发者公开抱怨，Fable 在 AI 研究类任务上变得不那么尽力。和前两个设定不同，这一层没有写进任何条款，也没有任何提示。Simon Willison 有篇文章的标题说得很直白：如果 Fable 不再帮你，你可能永远不会知道。

如果把三个设定放在一起：拦截是明面条款，留存是强制条款，“降智”是不可见的条款。而从拒绝不计费、转接有补偿、响应结构在文档里写得清清楚楚可以看出，这是 Anthropic 的有意设计，不是临时补丁。

二、这是契约问题，不是能力问题

过去几年企业选模型，比的主要是两样东西：能力和价格。能力看公开的 benchmark 或者自己的 POC，价格看账单，都摆在台面上。

但上面三个设定，benchmark 一个都测不出来。一个模型在评测集上分数再高，也不会告诉你它什么时候会把你的请求转给别人，你的数据会被留存多久，它在哪些领域会突然变得不那么尽力。

这些不是能力参数，而是契约条款。

三个条款的可感知程度还不一样。拦截和留存还好说，“降智”完全没有标识，相当于直接把产品行为变成了黑盒：任务失败的时候，你分不清是模型能力不够，还是命中了某些背后的策略。

有人可能会说，触发率不到 5%，影响没那么大。但比例不是重点，重点是规则变了。分类器一定有误判，正当的安全研究、医药研发请求，也可能被拦下或者交给一个更弱的模型回答。就算拦截时明明白白告知了你，你也没有申诉通道，没有预判能力，对触发逻辑没有任何发言权。规则写在厂商那一侧，并且厂商可以单方面调整。这种感觉，在国内那些平台上做生意的人应该很熟悉：你在别人的地基上盖房子，地基的规则不归你定。

站在 Anthropic 的角度，这套逻辑可能是成立的。模型能力越强，网络安全、生物化学这些领域的风险就越真实，平台不可能让最强的能力裸奔，然后自己承担责任。今年以来 Anthropic 反复强调 AI 能力正在接近危险的临界点，发布 Fable 5 前几天还在公开提示风险，转头就把最强模型放出来，与其说是言行不一，不如说这套限制机制就是它给自己找到的那个台阶：能力可以开放，但要带着限制开放。

可是问题不在于管不管，而在于规则是否透明、被控制的人是否可感知。

也许这不会是 Anthropic 一家的做法。最强模型的分级供给会逐渐成为常态：普通用户用安全版，企业用户用带审计和留存的版本，被信任的组织拿到更高权限。某种意义上，买最强的模型会越来越像在银行开高权限账户：额度、用途、留痕、审查，一样都少不了。

而且分级已经不只发生在安全维度，也发生在价格维度。Fable 5 只在 6 月 9 日到 22 日这两周里包含在 Pro、Max 这些 coding plan 中，6 月 23 日起就会移出，继续用需要单独购买使用额度，按 API 价格计费，价格是 Opus 4.8 的两倍。先开两周尝鲜窗口，再把最强能力挪进单独计量的高价通道，这是教科书式的分级供给，典型的互联网“割韭菜”，看来，Anthropic 的创始人在百度工作那一年学到了挺多讨论。当然，也许随着竞争对手的能力进步，它也会自己打自己的脸。

对做 2B 软件的人来说，这个画面其实挺熟悉的。企业软件卖了几十年的就是权限分级、审计日志和合规方案，高级版比标准版贵的从来不只是功能，还有管控能力。只不过，新鲜的地方是这一次被管控的对象不是软件的使用者，而是模型的购买者。乙方熟悉的那套治理逻辑，第一次被甲方体验了一遍。

三、模型选型清单，要加四个新问题

作为一个常年采购和使用模型的人，也许下面四个问题需要加进自己的选型评审，和能力、价格、延迟放在一起考虑。

1. 限制策略是否透明。哪些场景会触发限制？规则是否公开？厂商会不会单方面调整？

2. 降级是否可感知。被转接、被限制的时候，调用方能不能从响应里识别出来？能不能记录下来，事后审计？

3. 数据留存是否可接受。留存多久？谁能看？和企业现有的数据合规协议怎么对齐？对金融、医疗这类行业，这一条可能直接就是一票否决。

4. 责任归属是否清晰。因为策略限制导致任务失败、产生业务损失，这个责任算谁的？

第二条这次有个现成的参照：Anthropic 在 API 层面把拒绝做成了标准字段，写明是哪类分类器拦截，转不转给其他模型的开关也握在调用方手里。拿这个标准去问其他厂商就够了：你们的限制策略，做到这个程度了吗？

第三条我想多说两句。神策做了十年 2B，私有化部署一直是国内客户的主流选择，很重要的一个原因就是企业对数据出域极其敏感。但现在的局面是反过来的：最强的模型只有云端版本，留存政策由厂商单方面规定，连原来谈好的零留存协议都可以宣布不适用。如果国内基模厂商将来也跟进类似的安全策略，这个矛盾只会更尖锐。

这四个问题在过去的采购流程里几乎不存在，因为软件不会“看心情干活”，但模型会。

这有点像当年企业学会采购云服务的过程。早年大家只看功能和价格，吃过亏之后才知道要看 SLA、故障赔偿、数据出境条款。模型采购正在走同一条路，只是这次的条款藏得更深，藏在分类器和策略里，不主动问就不会有人告诉你。把这四个问题加进选型策略，成本很低，如果哪天真出了问题，这张表就是你和厂商扯皮的依据。

四、做 AI 应用的人，需要额外关注

如果你在模型之上做应用，这件事还有一层额外的提醒：你的产品建立在一个会变化的上游之上。

我们做 Omni-Growth 的过程中有个很深的体感：Agent 出错的时候，用户的第一反应是问为什么。广告投放是花真金白银的，一个建议给错了，用户不会满足于“AI 偶尔会犯错”这种解释。如果连我们自己都说不清楚，这次失败是模型能力不够，知识库有问题，还是触发了某个策略限制，用户的信任很快就会耗尽。

所以我们内部有一条原则：每一次任务失败，都要能回答“这是谁的问题”，是模型、数据、策略，还是我们自己的工程。这次，这条原则现在要往上游再延伸一层。上游有降级机制，你的产品就需要把“当前是否处于受限模式”暴露给你的用户；上游有留存政策，你就需要搞清楚自己对客户做出的数据承诺还能不能兑现。可观测性的要求正在向上游传导：模型厂商对你做的事，你的用户也会要求你做到。

五、硬币的另一面

再衍生一点，今天是模型厂商对你做管控：分权限、留日志、设降级、定责任。而等你的企业里真的跑起来几十个 Agent，你会发现自己要对它们做的，也是一模一样的事。

给 Agent 开通内部系统权限的时候，你大概率也会设计一个“高风险操作转人工”的机制；为了出问题能追溯，你大概率也会要求全量留存操作日志。到那一天，你就是自己公司里的 Anthropic，今天你对它的全部不满，反而会变成你设计 Agent 制度时的参考答案。

这套东西有个名字，叫 Agent Control Plane，企业管理数字劳动力的中控台，后面有机会再展开。

最后留一个问题：你们公司采购 AI 的时候，问过“它什么情况下会拒绝，什么情况下会变弱”吗？欢迎在评论区聊聊，个人观点，仅供参考。

本文作者曹犟正在和团队打造 Omni-Growth Agent，目标是用 AI 帮中国公司把海外营销做得更稳、更可控。目前主要服务两类需求：一类是把投放全托管给我们，按增长结果付费；另一类是给现有投手配一个 7×24 盯盘和诊断的 AI Copilot。更多信息可以看这里：https://omni-growth.ai

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-06-11，如有侵权请联系 cloudcommunity@tencent.com 删除

企业