CLI时代结束了，SaaS股我现在就买！一年前押中Claude Code的人又下了五个反共识赌注

乐小野

发布于 2026-06-05 09:05:28

去年5月，Every的CEO Dan Shipper在Lenny播客上抛出过一个当时几乎没人当真的押注，提出Claude Code那个还没正式出圈的命令行Agent，会变成非工程岗位的日常工作入口。后来，众所周知，这件事被Anthropic自己用Cowork验证了，OpenAI跟着发了Codex桌面应用，连不会写代码的运营、编辑都开始把PR当邮件一样递。

Every这一年从15人涨到30人，内部同时跑了6个软件产品，整个团队不分岗位都在用Codex/Cowork/Claude Code。基于这一年的现场体感，Dan又扔出五个反共识赌注，其中至少三个跟当下AI圈的主流叙事完全相反。感兴趣可以一起讨论下。

第一个赌注，公司里只会留一个超级Agent

主流叙事里，AI的终态是人手一个agent，绑在你的Slack上像金色罗盘里那只灵兽一样跟着你。OpenClaw（Every自己的agent harness）刚上线的时候他就在推这个路线。

然后现实不是这样。每个人各自维护自己的agent，挂掉了得自己SSH进去修，工作流断一次就没人愿意再碰，最后多数员工干脆放弃。

所以现在他的判断是，至少未来12个月里，公司层面会先沉淀出一个超级agent，而不是人手一个。

Yes

公司里第一个超级Agent

由forward deployed engineer全权维护

全员都能在Slack里调起来

模型独立性是否突破

再往下拆出团队级Agent

最后才到个人级Agent

就停在超级Agent这一级

Dan点了两家公司的名，Shopify已经有了一个面向全员的agent，Ramp也有一个。Every内部的那个叫Claudy，专门跑咨询业务，由一位AI工程师Nitesh每天在Slack里盯着调。

为什么不能是人手一个——"every agent needs a human"。一旦切断了「有人在认真维护它」这条线，agent立刻就废了。这个判断后面会反复出现，是Dan整套预测的基础设定。

第二个赌注，CLI时代已经速通完了

这一条最反共识。今年AI圈的主流情绪是终端复兴，Claude Code/Codex/Crush/Aider一堆CLI产品爆火，连不写代码的人都开始学tmux和zsh。Dan的判断是这件事就到此为止，CLI不会消失，但作为主要的AI工作面，它已经被速通完了。

CLI火起来的时候，所有人都以为是终端这个介质带来的能力，实际上是agent harness里那个loop带来的能力。一旦这个loop被搬到GUI里，哪怕只是Codex桌面那种带in-app browser的设计，体验立刻就翻盘。

Every自己的技术员工里，绝大多数已经不再把CLI当主工作面，更不用说非技术岗。Dan自己每天主用Codex桌面应用，里面开一个in-app browser，agent能直接看到他在网页里做什么，反过来他也能看到agent在写什么。

Dan的原话是「we speed ran the CLI era」（我们速通了CLI时代）。这个表达大概率会成为今年下半年AI产品圈的口头禅。

第三个赌注，SaaS不仅不会死，反而要被Agent买爆

去年到今年，「SaaS末日论」是Lenny播客上的常客话题，几乎所有受访者都给Salesforce、Workday、HubSpot之类的公司判过死刑，理由是AI能让用户自己vibe code一个替代品。

Dan的判断完全相反，他原话是

the SaaS pocalypse is dumb，I would buy SaaS stocks right now

这里主要逻辑分两层。

第一层，Every这种最AI native的公司，过去一年的SaaS采购预算反而是涨的。员工每个人都用Codex/Cowork当主工作面，但没人真去重写一个Notion或Slack。Dan在采访里反复说一句话，agent不是来替代SaaS的，agent是SaaS的新增用户。

第二层更妙一点。当用户主要的工作面是Codex/Cowork的时候，SaaS厂商的token成本反而被卸掉了。用户带着自己的token进入你的产品，agent在用户的账号下调你的API、读你的HTML、点你的按钮。Every自己的开源markdown编辑器Proof就是这么设计的，它根本不付推理费，所有token都是用户那边在烧。

旧叙事下的SaaS业务模式	Dan预测的新模式
SaaS厂商付token，包进订阅费	用户从Codex/Cowork带自己的token来
AI按席位/月计价，毛利被推理成本压垮	SaaS厂商专注做agent友好的接口和HTML
终端用户全部是人	终端用户里相当比例是agent
最怕用户vibe code替代品	最关心怎么设计「人和agent同时在场」的UI

按这套逻辑，过去一年砸钱做"AI Copilot"的SaaS公司其实走错了方向，正确的姿势是把产品改造成agent能高效操作的形态，把token成本甩给用户带的agent。

第四个赌注，Codex/Cowork会变成新的工作操作系统

这一条和上面那条是连着的。他写文档的时候，在Codex里开一个thread，里面挂着in-app browser，浏览器里打开Proof，员工自己在Proof里写正文，agent同时在边上review、跑research、改格式。

基本就靠Codex+Quora（Every的邮件agent）做到了连续10天inbox zero。流程是Quora每天把所有邮件聚合到一个Codex渲染的页面里，用语音对每封邮件下指令，agent去查资料、起草回复、整理附件，确认完一键发出。

Codex/Cowork桌面应用

in-app browser

CLI窗格

文件系统直连

访问任意SaaS网页

执行本地命令/调API

直接改本地文件

人和agent同看同操作

agent帮你跑research/写文档/收发邮件/改代码

Dan在采访里把这套结构直接称为operating system for work。这个说法里面有一个很重要的产品判断，agent要发挥能力的前提是和人共享上下文，所谓共享上下文就是「能看到你在看什么、能改你正在改的东西」。所以Codex桌面带浏览器，Cowork带CLI tab，Cursor带cloud agent，全都在往这个方向收。

被甩在后面的可能是Cursor。Dan的判断是Cursor的cloud实现已经领先Anthropic和OpenAI，但产品定位还卡在「给程序员用」，不肯往generic知识工作场景跨一步。如果模型能力继续按现在的速度涨，Cursor可能错过最大的那块蛋糕。

第五个赌注，AI失业潮是伪命题，PM和全栈设计师反而要起飞

这是最反主流叙事的一条。Anthropic的Dario天天预言白领大规模失业，OpenAI的Sam也在反复强调AGI对就业市场的冲击，Every这家自称最AI forward的公司过去一年人翻了一倍。

Dan给了一个挺关键的认知框架，模型干的事情是把「昨天的人类能力」变便宜了，所以这部分能力会被瞬间商品化。但人类在做的事情，是拿这些被商品化的昨天的能力，去做没人做过的新东西。

两个最被低估的角色被重点点名。

第一个是PM。Every内部一个叫Marcus的PM，转岗前在Axios跑写作产品做到几千万ARR，在家AI pilled了一年，现在在Every里跑Spiral这个写作App。他不是科班工程师，但靠Codex能独立从需求一路写到production PR。Dan说这种人现在「dangerous」（褒义），ship速度比团队里大多数纯工程师还快。

第二个是全栈设计师。这个角色之前一直被认为是过渡产物，AI能直接生成UI之后会被替代。Dan的判断完全相反。vibe code出来的东西看着都一样、都很slop，能做出独特视觉和交互的全栈设计师反而稀缺到爆。Every内部的设计师现在都是直接提PR，不再走「设计稿丢给前端再一轮一轮对齐」那套老流程。

一个不太舒服的诚实话，Agent需要人陪护

整场采访Dan反复说一句话，

Every agent needs a human.

大家应该都被坑过。如果你也用过vibe coding，做过发布，应该能体会配置或运行效果每隔几天挂一次的窘况。Codex基本回答一致「我知道问题在哪、我修好了」，但每修一次又冒出新错误。

Vibe coding从来没有想象的美好。

Dan请了两位senior engineer各自从零重写了一遍代码库，把这两份重写当成senior engineer benchmark。所有当下的coding模型在这个benchmark上拿到的分数都在30/100上下，人类senior engineer是80~90，GPT-5.5是第一个跳到60的模型，主要的提升来自它「敢撕掉旧代码从头重写」的agency。

遇到屎山

过去主流coding模型

局部打补丁

bug一边修一边长

人类工程师必须介入

GPT-5.5

直接撕掉重写

人类工程师只需要review大方向

他的判断是模型再涨一年，分数能到senior engineer水平，但这件事不等于「不再需要senior engineer」。因为benchmark只能给那些「人类已经把问题框出来、能打分」的任务打分，而真正的senior engineer工作里有大量「先意识到问题、再框出来、再说服团队接受这个框法」的环节。这部分工作没法benchmark，也就没法被自动化掉。

所以Every过去一年还在加人，加的主要是forward deployed engineer，专门负责把agent管起来、把流程框起来、保证非技术员工能在不出大事的前提下用上这些能力。

几个还要再观察的点

第一，超级agent模式能撑多久。Dan自己也承认personal agent这条路只是被模型能力暂时压住了，一旦模型能独立处理harness维护，公司层面的super agent可能会再被拆回到团队级、个人级。这个时间点他没敢猜。

第二，Codex/Cowork之外的第三种工作面。Dan只押了Codex和Cowork两家会跑出来，但他自己也说Cursor这种基于编辑器的harness还在演化，更不用提那些做cloud agent的新厂商。Codex桌面+in-app browser是不是终态形态，目前看不清。

第三，AI写作的接受度。Dan说他绝大部分邮件已经是Codex代写的，他自己甚至想在邮件签名里加上「from GPT-5.5」。但社会层面对AI生成内容的反感还在涨，这条路径在企业内部能跑通，到外部沟通能不能跑通，是个开放问题。

第四，token spend会不会变成新的KPI军备竞赛。Meta搞了员工token排行榜，已经开始有「谁烧得多谁有面子」的迹象，Dan明确反对这种玩法，但这一年里大概率会有更多公司学Meta。

写在最后

五条预测里，最值得当下AI圈认真对待的是第二条「CLI时代速通完了」和第三条「SaaS不仅不会死、反而要起飞」。这两条直接冲撞了过去12个月里被反复强化的主流叙事。

如果他这次又押对，今年下半年到明年，做CLI native产品的创业公司要重新审视自己的GUI路线，做SaaS的厂商要重新审视自己的agent接口，做AI产品的工程师要把「人和agent同时在场」当成一等公民去设计。

References

1. Lenny's Podcast, Dan Shipper回访集，2026年5月，https://www.lennyspodcast.com
2. Lenny's Podcast, Dan Shipper第一次访谈「Claude Code为什么被低估」，2025年5月，https://www.lennyspodcast.com
3. Every官网，公司介绍与产品矩阵，https://every.to
4. Every，Spiral写作产品，https://every.to/spiral
5. Every，Proof开源markdown编辑器，https://github.com/every-org/proof
6. Every，OpenClaw agent harness介绍，https://every.to/openclaw
7. Anthropic，Claude Code发布公告，2024年5月，https://www.anthropic.com/news/claude-code
8. Anthropic，Claude Cowork桌面应用发布，https://www.anthropic.com/news/cowork
9. OpenAI，Codex桌面应用与in-app browser发布说明，https://openai.com/index/codex
10. Shopify，全员AI agent Sidekick介绍，https://www.shopify.com/sidekick
11. Cursor，Cloud agent能力页，https://www.cursor.com
12. Dan Shipper，The Allocation Economy，Every Chain of Thought专栏，https://every.to/chain-of-thought/the-allocation-economy
13. METR，autonomous task length benchmark，https://metr.org
14. The Information，Meta内部token排行榜相关报道
15. Bret Victor，Stop Drawing Dead Fish talk，https://vimeo.com/64895205

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-06-01，如有侵权请联系 cloudcommunity@tencent.com 删除

code