首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >最强模型 Fable 5,开始不让你随便用了

最强模型 Fable 5,开始不让你随便用了

作者头像
曹犟
发布2026-06-11 19:37:52
发布2026-06-11 19:37:52
2770
举报

你好,我是曹犟,欢迎关注我的公众号!

6 月 9 日,Anthropic 发布了新模型 Fable 5。

我是 Claude Code 的资深用户,整个工作流都是构建在其基础之上,这篇文章的很多信息收集和事实核查也正是用 Fable 5 完成的;我做的产品 Omni-Growth 也在大量使用 Anthropic 的 API。所以,我也注意到,Fable 5 这次出来之后,大家关于它的能力的讨论少了很多,而是都在讨论 Anthropic 这次的各种“骚操作”。

例如,有些媒体会说:“Anthropic 会把请求偷偷转给一个更弱的模型?”当然,Fable 自己对照官方文档查完后,回答得很老实:转是会转,但并不偷偷,API 会明确告诉你请求被哪个分类器拦下了,要不要转给别的模型,甚至由你自己决定;但是真正没有任何提示的,反而是另一件事。

这个回答让我写篇文章讨论这个事情,在我看来,它背后的变化,比“Anthropic 的新模型榜单刷了多少分”有意思得多。

一、Fable 5 的三个不寻常设定

过去预热了很久的 Mythos,是 Anthropic 内部最强的模型层级,只通过邀请制的 Project Glasswing 计划向少数获批组织提供。而这次发布的 Fable 5,其实就是它加上安全分类器之后的公开版,人人可用;Mythos 5 不带安全分类器,仍然只向获批组织限量开放。

同一个模型,两条供给通道,有三个有趣的设定。

第一个设定,高风险请求拦截与转接。当系统识别出请求涉及网络安全、生物化学或者模型蒸馏(Anthropic 在 X 上曾经炮轰过很多中国同行的蒸馏行为)时,请求会被安全分类器拦下,据说触发率平均不到 5%。在 Claude 官方应用里,这类请求会自动交给 Opus 4.8 回答,并告知用户;在 API 里做得更彻底:返回一个标准的拒绝响应,标明是哪个分类器拦截的,由调用方用一个显式参数自己决定是否转交给其它模型处理。被拒绝的请求不计费,转接重试还有专门的补偿机制,不让你为切换模型重复支付缓存成本。

第二个设定,强制 30 天数据留存。Fable 5 和 Mythos 5 的所有流量都会被 Anthropic 留存 30 天,用于安全审查。与之相对的,Anthropic 的其它模型则可以签零留存协议。更关键的是,企业原来签好的零留存协议,对这两个模型不适用,而且没有任何谈判空间。

第三个设定,某些领域的能力被有意控制了。已经有开发者公开抱怨,Fable 在 AI 研究类任务上变得不那么尽力。和前两个设定不同,这一层没有写进任何条款,也没有任何提示。Simon Willison 有篇文章的标题说得很直白:如果 Fable 不再帮你,你可能永远不会知道。

如果把三个设定放在一起:拦截是明面条款,留存是强制条款,“降智”是不可见的条款。而从拒绝不计费、转接有补偿、响应结构在文档里写得清清楚楚可以看出,这是 Anthropic 的有意设计,不是临时补丁。

二、这是契约问题,不是能力问题

过去几年企业选模型,比的主要是两样东西:能力和价格。能力看公开的 benchmark 或者自己的 POC,价格看账单,都摆在台面上。

但上面三个设定,benchmark 一个都测不出来。一个模型在评测集上分数再高,也不会告诉你它什么时候会把你的请求转给别人,你的数据会被留存多久,它在哪些领域会突然变得不那么尽力。

这些不是能力参数,而是契约条款。

三个条款的可感知程度还不一样。拦截和留存还好说,“降智”完全没有标识,相当于直接把产品行为变成了黑盒:任务失败的时候,你分不清是模型能力不够,还是命中了某些背后的策略。

有人可能会说,触发率不到 5%,影响没那么大。但比例不是重点,重点是规则变了。分类器一定有误判,正当的安全研究、医药研发请求,也可能被拦下或者交给一个更弱的模型回答。就算拦截时明明白白告知了你,你也没有申诉通道,没有预判能力,对触发逻辑没有任何发言权。规则写在厂商那一侧,并且厂商可以单方面调整。这种感觉,在国内那些平台上做生意的人应该很熟悉:你在别人的地基上盖房子,地基的规则不归你定。

站在 Anthropic 的角度,这套逻辑可能是成立的。模型能力越强,网络安全、生物化学这些领域的风险就越真实,平台不可能让最强的能力裸奔,然后自己承担责任。今年以来 Anthropic 反复强调 AI 能力正在接近危险的临界点,发布 Fable 5 前几天还在公开提示风险,转头就把最强模型放出来,与其说是言行不一,不如说这套限制机制就是它给自己找到的那个台阶:能力可以开放,但要带着限制开放。

可是问题不在于管不管,而在于规则是否透明、被控制的人是否可感知。

也许这不会是 Anthropic 一家的做法。最强模型的分级供给会逐渐成为常态:普通用户用安全版,企业用户用带审计和留存的版本,被信任的组织拿到更高权限。某种意义上,买最强的模型会越来越像在银行开高权限账户:额度、用途、留痕、审查,一样都少不了。

而且分级已经不只发生在安全维度,也发生在价格维度。Fable 5 只在 6 月 9 日到 22 日这两周里包含在 Pro、Max 这些 coding plan 中,6 月 23 日起就会移出,继续用需要单独购买使用额度,按 API 价格计费,价格是 Opus 4.8 的两倍。先开两周尝鲜窗口,再把最强能力挪进单独计量的高价通道,这是教科书式的分级供给,典型的互联网“割韭菜”,看来,Anthropic 的创始人在百度工作那一年学到了挺多讨论。当然,也许随着竞争对手的能力进步,它也会自己打自己的脸。

对做 2B 软件的人来说,这个画面其实挺熟悉的。企业软件卖了几十年的就是权限分级、审计日志和合规方案,高级版比标准版贵的从来不只是功能,还有管控能力。只不过,新鲜的地方是这一次被管控的对象不是软件的使用者,而是模型的购买者。乙方熟悉的那套治理逻辑,第一次被甲方体验了一遍。

三、模型选型清单,要加四个新问题

作为一个常年采购和使用模型的人,也许下面四个问题需要加进自己的选型评审,和能力、价格、延迟放在一起考虑。

1. 限制策略是否透明。哪些场景会触发限制?规则是否公开?厂商会不会单方面调整?

2. 降级是否可感知。被转接、被限制的时候,调用方能不能从响应里识别出来?能不能记录下来,事后审计?

3. 数据留存是否可接受。留存多久?谁能看?和企业现有的数据合规协议怎么对齐?对金融、医疗这类行业,这一条可能直接就是一票否决。

4. 责任归属是否清晰。因为策略限制导致任务失败、产生业务损失,这个责任算谁的?

第二条这次有个现成的参照:Anthropic 在 API 层面把拒绝做成了标准字段,写明是哪类分类器拦截,转不转给其他模型的开关也握在调用方手里。拿这个标准去问其他厂商就够了:你们的限制策略,做到这个程度了吗?

第三条我想多说两句。神策做了十年 2B,私有化部署一直是国内客户的主流选择,很重要的一个原因就是企业对数据出域极其敏感。但现在的局面是反过来的:最强的模型只有云端版本,留存政策由厂商单方面规定,连原来谈好的零留存协议都可以宣布不适用。如果国内基模厂商将来也跟进类似的安全策略,这个矛盾只会更尖锐。

这四个问题在过去的采购流程里几乎不存在,因为软件不会“看心情干活”,但模型会。

这有点像当年企业学会采购云服务的过程。早年大家只看功能和价格,吃过亏之后才知道要看 SLA、故障赔偿、数据出境条款。模型采购正在走同一条路,只是这次的条款藏得更深,藏在分类器和策略里,不主动问就不会有人告诉你。把这四个问题加进选型策略,成本很低,如果哪天真出了问题,这张表就是你和厂商扯皮的依据。

四、做 AI 应用的人,需要额外关注

如果你在模型之上做应用,这件事还有一层额外的提醒:你的产品建立在一个会变化的上游之上。

我们做 Omni-Growth 的过程中有个很深的体感:Agent 出错的时候,用户的第一反应是问为什么。广告投放是花真金白银的,一个建议给错了,用户不会满足于“AI 偶尔会犯错”这种解释。如果连我们自己都说不清楚,这次失败是模型能力不够,知识库有问题,还是触发了某个策略限制,用户的信任很快就会耗尽。

所以我们内部有一条原则:每一次任务失败,都要能回答“这是谁的问题”,是模型、数据、策略,还是我们自己的工程。这次,这条原则现在要往上游再延伸一层。上游有降级机制,你的产品就需要把“当前是否处于受限模式”暴露给你的用户;上游有留存政策,你就需要搞清楚自己对客户做出的数据承诺还能不能兑现。可观测性的要求正在向上游传导:模型厂商对你做的事,你的用户也会要求你做到。

五、硬币的另一面

再衍生一点,今天是模型厂商对你做管控:分权限、留日志、设降级、定责任。而等你的企业里真的跑起来几十个 Agent,你会发现自己要对它们做的,也是一模一样的事。

给 Agent 开通内部系统权限的时候,你大概率也会设计一个“高风险操作转人工”的机制;为了出问题能追溯,你大概率也会要求全量留存操作日志。到那一天,你就是自己公司里的 Anthropic,今天你对它的全部不满,反而会变成你设计 Agent 制度时的参考答案。

这套东西有个名字,叫 Agent Control Plane,企业管理数字劳动力的中控台,后面有机会再展开。

最后留一个问题:你们公司采购 AI 的时候,问过“它什么情况下会拒绝,什么情况下会变弱”吗?欢迎在评论区聊聊,个人观点,仅供参考。


本文作者曹犟正在和团队打造 Omni-Growth Agent,目标是用 AI 帮中国公司把海外营销做得更稳、更可控。目前主要服务两类需求:一类是把投放全托管给我们,按增长结果付费;另一类是给现有投手配一个 7×24 盯盘和诊断的 AI Copilot。更多信息可以看这里:https://omni-growth.ai

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-06-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 曹犟的随笔 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档