去年5月,Every的CEO Dan Shipper在Lenny播客上抛出过一个当时几乎没人当真的押注,提出Claude Code那个还没正式出圈的命令行Agent,会变成非工程岗位的日常工作入口。后来,众所周知,这件事被Anthropic自己用Cowork验证了,OpenAI跟着发了Codex桌面应用,连不会写代码的运营、编辑都开始把PR当邮件一样递。
Every这一年从15人涨到30人,内部同时跑了6个软件产品,整个团队不分岗位都在用Codex/Cowork/Claude Code。基于这一年的现场体感,Dan又扔出五个反共识赌注,其中至少三个跟当下AI圈的主流叙事完全相反。感兴趣可以一起讨论下。
主流叙事里,AI的终态是人手一个agent,绑在你的Slack上像金色罗盘里那只灵兽一样跟着你。OpenClaw(Every自己的agent harness)刚上线的时候他就在推这个路线。
然后现实不是这样。每个人各自维护自己的agent,挂掉了得自己SSH进去修,工作流断一次就没人愿意再碰,最后多数员工干脆放弃。
所以现在他的判断是,至少未来12个月里,公司层面会先沉淀出一个超级agent,而不是人手一个。
Yes
No
公司里第一个超级Agent
由forward deployed engineer全权维护
全员都能在Slack里调起来
模型独立性是否突破
再往下拆出团队级Agent
最后才到个人级Agent
就停在超级Agent这一级
Dan点了两家公司的名,Shopify已经有了一个面向全员的agent,Ramp也有一个。Every内部的那个叫Claudy,专门跑咨询业务,由一位AI工程师Nitesh每天在Slack里盯着调。
为什么不能是人手一个——"every agent needs a human"。一旦切断了「有人在认真维护它」这条线,agent立刻就废了。这个判断后面会反复出现,是Dan整套预测的基础设定。
这一条最反共识。今年AI圈的主流情绪是终端复兴,Claude Code/Codex/Crush/Aider一堆CLI产品爆火,连不写代码的人都开始学tmux和zsh。Dan的判断是这件事就到此为止,CLI不会消失,但作为主要的AI工作面,它已经被速通完了。
CLI火起来的时候,所有人都以为是终端这个介质带来的能力,实际上是agent harness里那个loop带来的能力。一旦这个loop被搬到GUI里,哪怕只是Codex桌面那种带in-app browser的设计,体验立刻就翻盘。
Every自己的技术员工里,绝大多数已经不再把CLI当主工作面,更不用说非技术岗。Dan自己每天主用Codex桌面应用,里面开一个in-app browser,agent能直接看到他在网页里做什么,反过来他也能看到agent在写什么。

Dan的原话是「we speed ran the CLI era」(我们速通了CLI时代)。这个表达大概率会成为今年下半年AI产品圈的口头禅。
去年到今年,「SaaS末日论」是Lenny播客上的常客话题,几乎所有受访者都给Salesforce、Workday、HubSpot之类的公司判过死刑,理由是AI能让用户自己vibe code一个替代品。
Dan的判断完全相反,他原话是
the SaaS pocalypse is dumb,I would buy SaaS stocks right now
这里主要逻辑分两层。
第一层,Every这种最AI native的公司,过去一年的SaaS采购预算反而是涨的。员工每个人都用Codex/Cowork当主工作面,但没人真去重写一个Notion或Slack。Dan在采访里反复说一句话,agent不是来替代SaaS的,agent是SaaS的新增用户。
第二层更妙一点。当用户主要的工作面是Codex/Cowork的时候,SaaS厂商的token成本反而被卸掉了。用户带着自己的token进入你的产品,agent在用户的账号下调你的API、读你的HTML、点你的按钮。Every自己的开源markdown编辑器Proof就是这么设计的,它根本不付推理费,所有token都是用户那边在烧。
旧叙事下的SaaS业务模式 | Dan预测的新模式 |
|---|---|
SaaS厂商付token,包进订阅费 | 用户从Codex/Cowork带自己的token来 |
AI按席位/月计价,毛利被推理成本压垮 | SaaS厂商专注做agent友好的接口和HTML |
终端用户全部是人 | 终端用户里相当比例是agent |
最怕用户vibe code替代品 | 最关心怎么设计「人和agent同时在场」的UI |
按这套逻辑,过去一年砸钱做"AI Copilot"的SaaS公司其实走错了方向,正确的姿势是把产品改造成agent能高效操作的形态,把token成本甩给用户带的agent。
这一条和上面那条是连着的。他写文档的时候,在Codex里开一个thread,里面挂着in-app browser,浏览器里打开Proof,员工自己在Proof里写正文,agent同时在边上review、跑research、改格式。
基本就靠Codex+Quora(Every的邮件agent)做到了连续10天inbox zero。流程是Quora每天把所有邮件聚合到一个Codex渲染的页面里,用语音对每封邮件下指令,agent去查资料、起草回复、整理附件,确认完一键发出。
Codex/Cowork桌面应用
in-app browser
CLI窗格
文件系统直连
访问任意SaaS网页
执行本地命令/调API
直接改本地文件
人和agent同看同操作
agent帮你跑research/写文档/收发邮件/改代码
Dan在采访里把这套结构直接称为operating system for work。这个说法里面有一个很重要的产品判断,agent要发挥能力的前提是和人共享上下文,所谓共享上下文就是「能看到你在看什么、能改你正在改的东西」。所以Codex桌面带浏览器,Cowork带CLI tab,Cursor带cloud agent,全都在往这个方向收。
被甩在后面的可能是Cursor。Dan的判断是Cursor的cloud实现已经领先Anthropic和OpenAI,但产品定位还卡在「给程序员用」,不肯往generic知识工作场景跨一步。如果模型能力继续按现在的速度涨,Cursor可能错过最大的那块蛋糕。
这是最反主流叙事的一条。Anthropic的Dario天天预言白领大规模失业,OpenAI的Sam也在反复强调AGI对就业市场的冲击,Every这家自称最AI forward的公司过去一年人翻了一倍。
Dan给了一个挺关键的认知框架,模型干的事情是把「昨天的人类能力」变便宜了,所以这部分能力会被瞬间商品化。但人类在做的事情,是拿这些被商品化的昨天的能力,去做没人做过的新东西。
两个最被低估的角色被重点点名。
第一个是PM。Every内部一个叫Marcus的PM,转岗前在Axios跑写作产品做到几千万ARR,在家AI pilled了一年,现在在Every里跑Spiral这个写作App。他不是科班工程师,但靠Codex能独立从需求一路写到production PR。Dan说这种人现在「dangerous」(褒义),ship速度比团队里大多数纯工程师还快。
第二个是全栈设计师。这个角色之前一直被认为是过渡产物,AI能直接生成UI之后会被替代。Dan的判断完全相反。vibe code出来的东西看着都一样、都很slop,能做出独特视觉和交互的全栈设计师反而稀缺到爆。Every内部的设计师现在都是直接提PR,不再走「设计稿丢给前端再一轮一轮对齐」那套老流程。
整场采访Dan反复说一句话,
Every agent needs a human.
大家应该都被坑过。如果你也用过vibe coding,做过发布,应该能体会配置或运行效果每隔几天挂一次的窘况。Codex基本回答一致「我知道问题在哪、我修好了」,但每修一次又冒出新错误。
Vibe coding从来没有想象的美好。
Dan请了两位senior engineer各自从零重写了一遍代码库,把这两份重写当成senior engineer benchmark。所有当下的coding模型在这个benchmark上拿到的分数都在30/100上下,人类senior engineer是80~90,GPT-5.5是第一个跳到60的模型,主要的提升来自它「敢撕掉旧代码从头重写」的agency。
遇到屎山
遇到屎山
过去主流coding模型
局部打补丁
bug一边修一边长
人类工程师必须介入
GPT-5.5
直接撕掉重写
人类工程师只需要review大方向
他的判断是模型再涨一年,分数能到senior engineer水平,但这件事不等于「不再需要senior engineer」。因为benchmark只能给那些「人类已经把问题框出来、能打分」的任务打分,而真正的senior engineer工作里有大量「先意识到问题、再框出来、再说服团队接受这个框法」的环节。这部分工作没法benchmark,也就没法被自动化掉。
所以Every过去一年还在加人,加的主要是forward deployed engineer,专门负责把agent管起来、把流程框起来、保证非技术员工能在不出大事的前提下用上这些能力。
第一,超级agent模式能撑多久。Dan自己也承认personal agent这条路只是被模型能力暂时压住了,一旦模型能独立处理harness维护,公司层面的super agent可能会再被拆回到团队级、个人级。这个时间点他没敢猜。
第二,Codex/Cowork之外的第三种工作面。Dan只押了Codex和Cowork两家会跑出来,但他自己也说Cursor这种基于编辑器的harness还在演化,更不用提那些做cloud agent的新厂商。Codex桌面+in-app browser是不是终态形态,目前看不清。
第三,AI写作的接受度。Dan说他绝大部分邮件已经是Codex代写的,他自己甚至想在邮件签名里加上「from GPT-5.5」。但社会层面对AI生成内容的反感还在涨,这条路径在企业内部能跑通,到外部沟通能不能跑通,是个开放问题。
第四,token spend会不会变成新的KPI军备竞赛。Meta搞了员工token排行榜,已经开始有「谁烧得多谁有面子」的迹象,Dan明确反对这种玩法,但这一年里大概率会有更多公司学Meta。
五条预测里,最值得当下AI圈认真对待的是第二条「CLI时代速通完了」和第三条「SaaS不仅不会死、反而要起飞」。这两条直接冲撞了过去12个月里被反复强化的主流叙事。
如果他这次又押对,今年下半年到明年,做CLI native产品的创业公司要重新审视自己的GUI路线,做SaaS的厂商要重新审视自己的agent接口,做AI产品的工程师要把「人和agent同时在场」当成一等公民去设计。