
大家好,我是程序员鱼皮。
昨天 Claude 背后的公司 Anthropic 在官网发了一篇重磅博客,同时在 Twitter 上也发了一条推文。

这条推文一发出来就炸了,已经有 800 多万次浏览,核心信息就一句话:
我们的内部数据显示,Claude 正在加速 AI 的开发进程,这可能是一条通往递归自我提升的路径,也就是 AI 自主构建更强的下一代 AI。
紧接着,不少国内媒体用了类似「Anthropic 呼吁全员停止 AI 研究」的标题来报道,看着还怪吓人的嘞,成功勾起了我的好奇心。
作为一个高频使用 Claude 写代码的程序员,我花了一个多小时把这篇英文博客完整读了一遍,发现了几个很有价值的点。原文很长,我会帮大家梳理出最核心的信息,也聊聊我自己的判断。
原文:https://www.anthropic.com/institute/recursive-self-improvement

这篇博客的标题是「When AI builds itself」(当 AI 构建自身),全文虽然很长,但核心就是在讲一件事:
AI 正在加速 AI 自身的开发,而且这个加速还在变快。
Anthropic 把这种可能的趋势称为 RSI(Recursive Self-Improvement 递归自我提升)。简单来说就是,AI 帮人类写代码,写出来的代码让 AI 变强,更强的 AI 又写出更好的代码,如此循环往复。

但 Anthropic 说了,这件事目前还没有真正发生,也不是必然会发生:
We are not there yet, and recursive self-improvement is not inevitable. But it could come sooner than most institutions are prepared for. 我们还没有走到那一步,递归自我提升也并非必然。但它到来的速度,可能比大多数机构准备好的要快。
所以这篇博客想表达的是,Anthropic 用大量内部数据来说明 AI 参与 AI 开发的程度正在快速加深,然后呼吁全行业认真对待这件事。
至于国内媒体说的「呼吁停止 AI 研究」,我觉得很扯,原文的表述其实是有前提条件的:如果存在一个 可验证的全球协调机制,能确保各家 AI 公司都没有私下继续加速研发,那 Anthropic 愿意减速甚至暂停。
这跟单方面宣布停工是两码事好吧?!
Anthropic 的「AI 自主进化论」是怎么得来的呢?
正如他们所说,他们在博客里放了大量 内部数据,我挑几个最有冲击力的跟大家聊聊。
截至 2026 年 5 月,Anthropic 代码库中合并的代码里,超过 80% 由 Claude 编写。
而在 2025 年 2 月 Claude Code 发布之前,这个比例还只是个位数。
一年多时间,AI 从偶尔帮忙写几行,变成了扛起绝大部分的编写工作。

2026 年第二季度,Anthropic 工程师每天合并的代码量是 2024 年的 8 倍。
原因很简单,他们的工程师并没有突然变强,而是大部分代码由 Claude 来写了,工程师的角色变成了指挥和审核。
虽然 Anthropic 很谦虚地说:代码行数不是一个完美的衡量指标,8 倍产出不等于 8 倍生产力。
但大的方向很明确了。
Claude 在那种最开放、最模糊、连最终结果应该是什么样都不确定的编程任务上,成功率从 2025 年底的 26% 涨到了 2026 年 5 月的 76%。

刚看到这个数据的时候我震惊了,真的是震惊,就有种感觉,好像 AI 已经可以很大程度上预测到我们编程任务需要做什么、解决什么问题了,甚至人类都不需要描述清楚。。。

举个具体例子,博客里提到,有一次常规升级导致上万个训练任务崩溃,工程师只给了 Claude 一些日志信息和集群访问权限。Claude 自己排查运行中的任务,逐项测试环境变量,最终发现是一个不起眼的调试标志在作怪,正是它触发了崩溃。
整个过程大约两个小时,换成人类工程师可能要花两到三天。
Anthropic 每发布一个新模型,都会做同一个测试:给 Claude 一段训练小型 AI 模型的代码,让它在保证正确性的前提下尽可能加速。
2025 年 5 月,Claude Opus 4 做到了 3 倍加速。2026 年 4 月,Claude Mythos Preview 做到了 52 倍。
作为对比,一个熟练的人类研究员需要 4 到 8 个小时才能做到 4 倍。
不到一年时间,这类任务上 Claude 已经远远甩开了人类。

Anthropic 给 Claude 布置了一个开放式的 AI 安全研究课题:一个弱模型能不能可靠地监督一个强模型?
然后让 Claude 自己提假设、设计实验、跑数据、分析结果。
两名人类研究员花了大约一周时间,把性能差距缩小了 23%。
而 Claude 消耗了累计约 800 小时的计算资源,成本约 1.8 万美元,把差距缩小了 97%。
试问那两名人类研究院的心理面积。。。

不过 Anthropic 也指出了这个实验的局限:人类仍然定义了问题和评分标准,而且结果并没有很好地迁移到更大规模的模型上。
但在给定边界内,Claude 确实完成了所有的实验设计。
摆完这些数据,Anthropic 接着讨论了未来可能怎么走,大家也可以想想,预测一下你觉得未来会怎么样?
第一种,涨着涨着就停了。
现在看到的指数曲线其实是 S 曲线,到某个拐点就会放平。可能「研究判断力」这种东西就是没法靠堆算力解决,需要全新的架构突破。又或者瓶颈出在能源和芯片的物理供应链上。
第二种,AI 持续加速,但人类仍然掌舵。
Anthropic 认为这是当前最可能的走向。一家 100 人的公司,可能做出过去 1 万人才做得完的事情,每个人都像是在指挥一组 AI Agent。但瓶颈不会消失,只是转移到下一个环节。比如代码写得飞快了,结果代码审查成了新的卡点。Anthropic 自己就遇到了这个问题。
We've also encountered this friction outside engineering. There has been an explosion of new ideas, initiatives, tools, and simulations—far more than we have the capacity to pursue. 我们在工程之外也遇到了这种摩擦。新的想法、新的工具、新的实验爆炸式涌现,远远超出了我们能消化的容量。
第三种,AI 完全自我迭代,开始自己设计并训练下一代。
如果真走到这一步,AI 的进步速度就主要取决于可用的算力了。人类会退到监督和验证的位置。
Anthropic 对此的判断是,如果真到了第三种情况,而对齐问题又没有解决好,偏差会在 AI 自我迭代的过程中逐渐累积,最终可能完全失控。这也是他们呼吁全行业重视的核心原因。

了解完博客的内容后,还有一个值得思考的问题:为什么 Anthropic 选择在这个时间点发这篇博客?
我让 AI 搜集了几个背景,放在一起看,也许能琢磨出一点儿东西。。。
我自己的判断是,这篇文章里既有真实的安全考量,也有公关策略的成分。
在 IPO 前夕发这样一篇文章,既强化了负责任的形象,也顺手秀了一把自己内部的技术沉淀。
作为一名程序员,看完这篇博客,除了前面 AI 应对开放式任务的成功率大幅提升之外,其他的地方对我内心倒没有造成什么太大的波澜。因为我自己 99% 以上的代码基本都用 AI 来写了,我从 23 年开始就用 AI 编程到现在,亲身经历了 AI 强度的变化。
而且 AI 发展了,人类就没有优势了么?程序员就没有自身的价值了么?
并非如此,Anthropic 自己在博客里也承认了:
An area of human comparative advantage, for now, is research taste and judgment, including choosing which problems matter, which results to trust, and when an approach is a dead end. 人类目前的比较优势在于研究品味和判断力,包括选择哪些问题值得做、哪些结果可以信任、什么时候该放弃一条路。
执行层面的工作确实正在被 AI 接管,但方向判断、需求理解、产品设计、技术选型这些事,目前还是得靠人来做。
AI 现在能做到的是「你告诉它做什么,它帮你执行得很好」,但「应该做什么」,它还很难替你决定。
这跟我之前分享过的观点是一致的:AI 编程带来的核心变化不是让你写代码更快,而是让你能做到以前做不到的事情。 以前一个人往往只能深度负责一个模块,现在你有机会指挥 AI 同时推进好几个方向。
所以我的建议是:
1)不用焦虑,但要保持学习
谁都不知道拐点什么时候来,持续跟进 AI 工具的发展、保持自己的技术判断力,是当下最务实的做法。
2)把精力放在 AI 还做不好的事情上
需求分析、系统架构、用户体验这些需要理解真实世界的事,短期内没那么容易被替代。
3)学会指挥 AI 做项目
你不需要亲自写每一行代码了,但你得能判断 AI 写的代码好不好、方向对不对、哪些坑要避开。这跟以前带团队其实是一回事,只不过现在你带的是一群 AI Agent。