
"AI跃迁者调研"是 AI 透镜的深度对谈系列。跃迁并非线性进化,更像推翻、迭代、再重建。我们每期会邀请一位AI跃迁者,AI 原生创业者、AI转型的企业一号位或用 AI 重做自己的超级个体,分享他们想的结论、拆的过程、建的逻辑、交的学费,和在持续变化里守住的东西,给同样走在这条路上的人一些真实的参照。
第四期,我们邀请到了 Multica 创始人张佳圆。Multica 是一个开源的 Agent 协作与编排平台,连续霸榜 GitHub Trending,一周涨 1.2w Star,访谈的时候,GitHub 收获 2.75w Star,平台上每 10 秒触发一个 Agent 任务。做出这件事的团队只有 4 个人,而且这 4 个人本身也是 Multica 最极端的用户,他们自己就是一个 4 人加几十个 Agent 的超级小团队。
这期我们聊了 Multica 到底在做什么、Agent Team 的协作逻辑、4 人团队真实的一天是怎么运转的,以及在 Agent Native 的组织里,什么工作给人、什么工作给 Agent、人在这里面还剩下什么。
【金句洞察】
1. 整个组织的产出效率瓶颈,其实现在已经是人了,而非 AI 或者 Agent。
2. 建太多层级,是对人类这种低效组织的一个拙劣模仿。
3. 供给侧生产侧变得无限之后,决定不去做什么事情,可能来得更加重要。
4. 即使你快速做一个错误的决策,要比你缓慢地做一个正确的决策来得更好,因为你做了错误的决策总是可以去修整它,但你犹豫不决的话,就会导致整个组织因为你这一块而 block 在这里。
5. 你只要活得足够久,可能是你一个很大的壁垒了。
6. Multica如果失败了,但是它启发了下一代操作系统的诞生,我觉得这可能就是很有意义的事情。
7. 人的思考在 AI 时代是被低估的。AI 给你吐出来的东西可能是一个 P50 的东西,就是中位数。
调研嘉宾简介:
张佳圆 Multica 创始人,前 TikTok 工程师。做过 AI 搜索、AI coding 工具,最终做了 Multica,一个开源的 Agent 协作平台。
余一 腾讯研究院高级研究员,主要研究AI原生产品创新和公司变革,多年风险投资及生态孵化经历。领英中国年度行家、腾讯年度AI优秀行家和优秀分享,得到 AI 学习圈导师。
【调研速览】4 个人加几十个 Agent,他们是怎么让 Agent 像团队一样干活的?
核心问题:当你有一堆 Agent,你怎么让它们像一个团队一样协作,而非各自为政或互相抢活?
产品定位:协作层,而非 Agent 本身

产品定位:协作层,而非Agent本身
Multica 做的是 Agent 的编排与协作层。核心逻辑是:组织里用的 Agent 不可能只有一个,未来的组织或企业也不可能绑定在某一个 Agent 上,团队成员现在每个人既使用 Claude Code,又用 Codex,又用 Manus。Multica 更多是想在中间做一个模型和平台中立的协作层,处理多个 Agent 怎么分工、怎么传递任务、怎么合并上下文这些事情。
产品的三个核心概念:运行时(Agent 运行的机器,可以是本地 MacBook、Mac Mini 或服务器,统一注册到 workspace)、智能体(相当于 AI 员工,可以分配任务、设置角色)、Agent Team(多个 Agent 组成的小队,有自己的工作流程)。日常使用模式是:创建任务、分配给对应的 Agent 或 Agent Team,人只需最终做一个 review,等 Agent 需要你介入的时候,出现在你的 inbox 里面。
组织架构变革:去掉中间层,一个人端到端

组织架构变革:去掉中间层,一个人端到端
Multica 团队 4 个人现在都是 builder,没有固定的岗位边界。组织变革最大的一个点是:去掉了人与 Agent 之间的中间传递层。以前多人协作时,你要把大脑中的 context 先 share 给一个人,他经过演绎再 share 给 AI,这里面有很大的信息损耗。既然这个中间的人只是在做信息传递,为什么不直接把他拿掉,由上层的人直接和 Agent 沟通?所以现在基本上就是一件事由一个人主要 handle,从 PRD 到研发到测试验收,整条环节都由同一个人来负责。
Agent 设计原则:三类角色,最多两层

Agent设计原则:三类角色,最多两层
张佳圆认为,所有的 Agent 协作最终可以归结为三类角色:Orchestrator(协调者,类似项目经理,做任务拆分和分配)、Worker(执行者,接到 task 就开始干活)、Validator(验证者,对执行结果做验证)。
层级建议:最多两层,不需要更多。 人类组织需要多层级,本质上是在做信息聚合,原因在于人的带宽有限,你没法同时管 1000 个人。但 Agent 没有这个限制,建太多层级是对人类这种低效组织的一个拙劣模仿。
另外,Orchestrator 和 Worker 不需要每个任务都换一个新的 Agent,同一个 Agent 完全可以泛化,既做任务拆分,又写代码。主 Agent 的价值在于它需要跟你做交付,不管是面向你还是面向市场,每个任务都共享同一个通用的验收逻辑。
工作流与基础设施:周一 planning,每天 6 点 demo,其余交给 Agent

工作流与基础设施:周一planning,每天6点demo,其余交给Agent
他们一周只有两个固定会议:周一 weekly planning(Agent 提前准备好会议文档和上周数据分析);每天晚上 6 点的 demo 站会(Agent 会先把今天提交了哪些代码整理出来,demo 完没问题就直接部署上线,不再单独 review 代码)。其余时间,每个人自己和自己的 Agent 完成这周的任务。
已上岗的 Agent 岗位包括:每人一个本地 coding agent + 一个 24 小时运行的团队公共 coding agent(部署在 Mac Mini);接入 PostHog 数据库的数据分析师 Agent(既能写代码又能分析,比过去合作的大部分数据分析师都强大);专门做部署和运维的 Agent;go to market 的 Agent(分析热点内容,联系 KOL 做前置沟通)。有 Agent 淘汰制,觉得没有必要的,一键淘汰。
人的边界:只剩下需要和人沟通的工作

人的边界:只剩下需要和人沟通的工作
判断什么工作给人、什么工作给 Agent 的标准很简单:用户运营、用户访谈这类必须和人沟通的工作,目前还是得人来做,因为对方期待的是和一个人沟通。除此之外,其他所有的工作本质上都是给 Agent 配一个人,做 review、监督、看着他就可以了。
在招人上,他的标准是 high agency,自主主观能动性强。背景、专业、经验不是特别重要,因为你再怎么强,也很难强过 Agent。有 AI 或者 Agent 作为杠杆,理论上能够学会任意的事情。
核心指标:Agent idle 率

核心指标:Agent idle 率
他们内部用一个指标来评估一个组织 AI Native 的程度够不够彻底:Agent 的 idle 率,也就是闲置率。大部分人使用自己的 Agent,Agent 的满载时间可能也就在每天两三个小时,有 20 个小时都是闲置的。假设你的 Agent 可以一天运行 24 小时,你为什么让它只运行 14 个小时?降低 idle 率,是在一个组织里面需要去持续考虑的问题。
代价与未解张力

代价与未解张力
信任问题还没有解决。现在团队里有 1000 多件完成的任务,但还有很多在等待人来 review,他们可能还是不放心 AI 直接把最终的代码 merge 到代码库里。张佳圆承认,这个信任建立的过程,需要随着 Agent 给你做的事情越来越多才会逐渐提升,但目前还没做到。
另一个代价是思考的退化。张佳圆和余一都提到了这个问题:使用了 AI 之后,你的思考过程其实在逐渐降低,可能未来几年后你的思考模式会不会退化,这是他们都在担心的点。张佳圆现在每天刻意写 journal,不是所有的事情都让 AI 去做;有一些决策,会先自己思考一个版本之后,再去跟 AI 进行讨论。
完整访谈
快问快答 · AI 跃迁十问
余一:我们来做一个系列固定的快问快答环节,每期共同的 10 个问题。我会克制一下,有很多触发点留到后面继续聊。
问:你现在每天跟 AI 在一起几个小时,最大的一块时间在做什么?
张佳圆:最近这段时间,因为在外面交流比较多,可能每天也就四五个小时。之前 focus 在做产品的时候会更长,每天十个、十几个小时。有一天甚至从旅游回来的第一天,我和 AI 待了差不多 17 个小时,一直在 coding。
主要都是在 Multica 上,一方面是 coding,一方面是做 research,还有 go to market、数据分析等等,基本上都是去和 Agent 完成的。我这个人在里面能够输出的点其实非常少,更多是去指挥我的 AI 给我干活。
余一:从 17 个小时降到四五个小时,发生了什么?
张佳圆:主要是从 Maker Mode 变成了 Manager Mode。Paul Graham 有篇文章讲管理者和 Builder 的区别,Builder 需要长时间专注,Manager 更多是和其他人交流做管理相关的事情。最近业务发展比较快,需要做用户调研、用户访谈,所以 Maker Mode 的占比就降低了。
余一:昨天大橘说 coding 对于创始人而言是一种奢侈品,只能在特定时间充分享受。
问:因为 AI,你彻底改变的一个习惯是什么?
张佳圆:我几乎所有的问题都会先去问 AI。在这之前可能更多的会自己做搜索、做调研,但现在一有新的问题,就快速去问一下 AI,有了宏观了解之后再细化去看某些细节。之前 Google 搜索是使用最频繁的,但现在几乎已经都不用了。
问:你现在的 AI Token 消耗量是什么样子,消耗在哪里?
张佳圆:现在平均每天可能在几亿,两三亿的规模。前段时间 coding 比较多的时候,可能每天能达到十亿的规模。主要还是在 coding,因为 coding 是一个比较消耗 token 的场景。
问:作为创始人,你因为 AI 重新思考的那一个问题是什么?
张佳圆:我觉得我重新思考的问题可能就和思考这件事情本身有关。因为人本身存在很大的惰性,使用了 AI 之后,你的思考过程其实在逐渐降低。我不知道,假设你思考的占比逐渐降低,可能未来几年后你的思考模式会不会退化,这可能是我比较担心的一个点。
所以我现在每天会刻意留一些自己思考的时间,写 journal,不是所有的事情都让 AI 去做。比如有一些决策,我有时候会先自己思考一个版本之后,再去跟 AI 进行讨论。
余一:我跟你担心的问题其实是一样的。我基本被托管给 AI 的状态,最近就开始说感觉自己有脑雾了。有时候思考它本身是一种奖励,你有想通某些事情,或者说你想靠自己摩擦一下自己的大脑,那种也是一种快乐。
问:AI 让你对你的组织、业务和产品做过的最大的一个改变是什么?
张佳圆:我们基本上整个公司现在都是跑在 Agent 上面了,人在这里面的角色更多是做更加上层的目标制定、中间或结果的 review,其他的事情几乎都是让 AI 来做。
工作模式也和过去发生了很大改变。现在基本上一个人端到端地承接一个具体的事情,比如拿产品开发来举例,他会从产品设计、PRD 到研发再到测试验收,整条环节都由同一个人来负责。
这里面有一个最大的点:Coding Agent 的能力提升上来之后,人在多人合作模式里面的摩擦其实非常大,你要把大脑中的 context 先 share 给一个人,然后他经过演绎再 share 给 AI,这里面有很大的信息损耗。那既然这个中间的人只是在做信息传递,为什么不直接把他拿掉,由上层的人直接和 Agent 沟通? 所以我们现在基本上就是一件事由一个人来主要 handle,可能其他人会在中间做一些决策性的 review,但不会从一个人 handoff 到另一个人再交给 AI。
问:你的组织跟 AI 或者 Agent 的匹配度,1-10 分,你会打几分?
张佳圆:我觉得 8.9 分,非常匹配。
余一:那你觉得十分的理想团队是怎样的,还是说少打一两分是谦虚?
张佳圆:一方面是还有一些提升空间。我们本身就是一个和 AI 或者 Agent 耦合非常重的组织,假设把 AI 这个环节从我们组织里面拿掉,整个组织的价值会降低非常多。
我理想中的一种组织,可能人在整个组织里面占一个非常小的比例,大部分的 worker 都由 Agent 来代替,人在这里面只是做一些上层的决策。比如说一个 10 个真人的团队,加上 100 个甚至 1000 个 Agents,这可能是未来的理想模式。
余一:你现在是四个人加多少个 Agent?
张佳圆:可能几十个吧,十几个常用的,也就 10 个左右。
问:去打造 AI Native 或者 Agent Native 的产品和组织的时候,你遇到的最大的挑战是什么?
张佳圆:最大的挑战有两点。
第一,整个组织的产出效率瓶颈,其实现在已经是人了,而非 AI 或者 Agent。 Agent 本身的智能已经非常强,能够完成非常复杂的工作。但人的注意力带宽非常有限,同时可能做 3、5 件事情就已经很难 handle,更没法做 10 件事。而 Agent 完全 OK,只要 token 给得足够,它可以并行做几十件、上百件事情。所以在整个组织的效率瓶颈里,人是最大的摩擦。
第二,人和 Agent 之间的信任建立还没有做得那么好。 现在大部分人的工作是:AI 做了某个事情之后,我一定要看一下它做得怎么样,即使它可能做得很好,也不会对它做什么修改,但就是不太放心,要最终看一下。
我觉得这是一个信任建立的过程,我们会觉得现在的 Agent 可能不能 100% 给到我们很好的效果,虽然我觉得它其实已经能够了,只不过因为我们对它还没有做到 100% 信任。这个信任可能会随着 Agent 给你做的事情越来越多逐渐提升。
问:模型层的变迁和边界拓展,对你意味着什么?
张佳圆:我觉得现在所有做 AI 创业或者 AI 产品的公司,不可避免地需要面对一个问题:你面对模型层该怎么做竞争。我们过去可能有一些错误的决策判断,比如正好做在了模型发展路线上,包括最开始做的 AI Search(AI 搜索)。
但我觉得现在 Multica 这个产品,它更多的是一个模型或者平台中立的产品。你在上面可以使用不同的 Agent,可以使用不同的模型来完成工作,我们的判断是未来的组织或企业不可能绑定在某一个 Agent 上。我们现在每个人既使用 Claude Code,又用 Codex,又用 Manus 等等一系列产品。Multica 更多是想在中间做一个中立的协作层,所以这可能是跟过去最大的区别,它不是在做一个单一的功能。
问:AI 时代什么被高估了、什么被低估了?你现在最坚定相信的一件事情是什么?
张佳圆:我觉得有一部分人的思考在 AI 时代是被低估的。 人在整个跟 AI 协作过程中的思考,其实还是有很大作用的。因为 AI 是基于统计学、基于概率来做训练的,它给你吐出来的东西可能是一个 P50 的东西,就是中位数。它很难给你一个视角非常犀利或者非常特别的结果,除非你把大脑中的 context 告诉它,但这样又会产生 bias,因为它会偏向你给它的上下文。
所以我有时候会在 Google 搜索里加一个时间戳,比如 2022 年 11 月份之前的搜索结果,去看那个时候的结果和现在有什么差别。现在整个互联网几乎都充斥着 AI 内容,如果你模型用得多了,你可以一眼看出这是哪个模型写的。所以我觉得人的独特性在这里面还是一个非常重要的东西。
被高估了……我感觉现在好像没有什么特别被高估的事情。我觉得 AI 未来的发展一定会,就是人在这里面的价值,尤其是我们接触比较多前沿研究,我会发现人的价值在这里面可能真的不是特别重要了。我可能之前写了几十年代码,但我觉得我的 coding 经验在 AI 面前几乎没有太多价值,maybe 可能现在还有一些经验的价值,但可能再过一两三年你的价值就非常薄了。
余一:只能长叹一口气。那个时刻,去年当我看到某个 AI 产品做出来的东西,那种对内容的把握和预测的能力,我觉得比我强的东西是存在的。但当时会说,品味审美,在一些细微的地方还是有把握的地方。然后随着 AI 能力继续提升,你看它做的那些很细微的细节和对整体的把握,是几个崩溃时刻吧,就觉得审美品味这件事情,只要数据和反馈多了都可以做出来。
张佳圆:对,我觉得短期内人在这里面还是有很多价值,但长期来看,价值会逐渐变得很少。
Multica 产品演示:看板、智能体与 Agent Team

Multica 产品演示:看板、智能体与 Agent Team
余一:相信还是有挺多人对 Multica 比较陌生,虽然这几天我也各种用了一下,但我觉得用得并不到位,我之前问过朋友们,他说其实是因为我的工作太端到端了,我可以自己完成闭环,而 Multica 关于复杂的大项目和团队之间的管理,他觉得给他了完全不一样的体验。请佳圆给我们展示一下你的 AI Agent Native 的产品和团队的协作会是怎样?
张佳圆(屏幕分享中):Multica 是一个以开源项目形式发布的,简单理解来说,就是一个人和 Agent 的协作与编排平台。
我可以直接把我们内部的看板打开。你可以看到,我们有非常多的任务,现在可能同时在做 100 多件事情,AI 可能已经处理了 100 件事情,但还在等待人来 review,因为我们可能还是不放心 AI 直接把最终的代码 merge 到代码库里,还是会做一个最终的 review。最近已经完成了 1000 多件事情,这些事情都是由 AI 来完成的。
Multica 有几个比较核心的概念。其中一个就是运行时(runtime),或者更直白点就是 Agent 运行的机器,Agent 运行在哪里。比如说我可以把自己本地的 MacBook 注册到 Multica 的 workspace 里面。你可以看到有各自的 MacBook,有 Mac Mini,有服务端的 server。然后可以运行的 Agent 非常多,我们支持 Claude Code、Codex,甚至开源的 OpenCode,几乎所有主流 Agent 平台都已经支持了。
有了运行的机器之后,我们就可以创建 Agent,也就是智能体,相当于是一个 AI 员工的角色,和人一样,你可以在 workspace 里面给他分配任务。
还有就是 Agent Team,多个 Agent 组成的一个团队。比如这个是我的 coding team,专门用来帮助我写代码的。里面有几个不同的 Agent,Lambda 是我们家的猫,emax 也是我们家的猫,还有我们的数据分析师。这个 team 就像人类组织里面的一个团队,可能有自己的工作模式,比如我的 coding team 专门帮助我修 bug、写需求,会 follow 一个流程,可能先写 PRD,写完之后进行一些讨论,等等。
还有一个有点搞笑的,这是我们团队另外一个同学创建的独立团。你可以看到,里面所有的活动都是 Agent 在完成的,比如我们从 GitHub 上找了一个用户提交的 issue,让 Agent 自己来做修复,分配给独立团之后,这个小队就开始工作了。team leader 李云龙就开始做任务拆解,他是一个 orchestrator 的角色,主要做任务分配和拆解,然后分配给另外一个 Agent。比如意大利炮是专门用来做架构设计的,架构设计完了之后,他会去做 code review。人可能在这里面也会介入,但大部分是 Agent 自己在协作。
举个最简单的例子:我来新建一个任务,选择我的 coding 小队,然后我就不用管了。实际上我们日常就是:创建要做的事情,分配给对应的 Agent 或者 Agent Team,人只需要最终去做一个 review 就可以了。 等 Agent 需要你来介入的时候,会出现在你的 inbox 里面。这样就可以让我们并行同时做非常多事情,我们现在正在同时并行做 100 件事情,这在过去使用本地 coding Agent 其实是非常难做到的。
余一:我会比较好奇的就是刚才那个看板,它是给人看的还是给 Agent 看的?
张佳圆:现在其实主要还是给人看的。对于 Agent 来说,它不需要这样的 UI 界面,它可以通过命令行的方式拿到所有信息。但这个看板更多还是给人来看,人可能需要对这个任务有一个感知。
实际上我们现在也不怎么看看板,我们更多 focus 在需要我们去做的事情,就是我们的收件箱里面。比如我的 Lambda 这个 Agent 写了一个产品的 PRD 文档去分析用户提交的问题,写完之后会 @ 另外一个 Agent 来做 review,然后我的 emax 这个 Agent 正在做产品方案的 review。实际上我中间其实不用管这些中间环节,他们就在干活了。
余一:我看完之后,觉得我应该会很快上手试一试,因为我最近的困扰也是:AI 做得太快了,人参与到什么程度很难拿捏,最终拍板还是人来做,但如果让我一直在 loop 里面,问题已经超过脑雾,可能是脑子直接烧掉。
所以我之前给自己打造的机制叫异步沟通,其实跟这个有点类似,你就尽管做吧,除了我的红灯之外的东西,你就做出结果来,非得让我决策的放在决策栏,都做完了需要我反馈的放在反馈栏。一开始是用 Markdown 来管理,后来发现 Markdown 不适合读,后面让他做了一个类似看板的形式,每次就是一溜点开,然后回馈说验收,会发现大部分情况下其实也都是回验收归档而已,但好像还是要过人那一档。
张佳圆:对,所以我觉得你非常需要Squad小队这个功能,你可以创建你的一个 Agent 小队,然后就全部交给这个小队来做了。
余一:对,因为我一直以来的梦想就是被 AI 余一包养嘛,我一直希望他就做那个 CEO,然后我就在后面喝茶喝咖啡看看电视就好了。有时候觉得我浪费 token 也无所谓,但会发现那个决策机制、角色模糊还是普遍存在的,这也是我最近比较困扰的地方,看到你那个产品,我觉得挺兴奋的。
Agent 设计:三类角色、最多两层、orchestrator 不用换

Agent 设计:三类角色、最多两层、orchestrator 不用换
余一:这里面我会有一个问题,Agent 的小队,大家说 Agent 有不同的模式,我之前用得比较多的还是 sub-agent,这个是不是更加偏向去中心化的 Agent Team 的状态,还是说其实是主 Agent 加一些 sub-agent 的方式?
张佳圆:正好前几天我去 Google 做了一个关于多 Agent 协作的分享。总结下来,核心的原子模式可能就是几种:委派模式(主 Agent 加 sub-agent,这是现在所有 Agent 产品都会用的模式);creator-verifier 模式(一个专门做实现,另一个专门做验证);Agent 之间直接通讯(直接发 message 给另一个 Agent);协商模式(Agent 完成一件事情后,广播这个完成状态到整个 Agent 系统里,让其他 Agent 来决定谁做下一步)。
整体来看,所有的 Agent 协作基本上可以分成这几类。然后从架构角度看,我觉得只需要有三种类型的 Agent 就可以了,Orchestrator(协调者):做高层次的任务拆分和分配;Worker(工人):接到 task 之后就开始干活;Validator(验证者):专门对执行结果做验证。
余一:我还挺开心的,现在我整个 Agent 的设置,AI 余一承担的是协调者,因为要用最好的模型,需要去了解需求,制定验收标准,以及中间哪些东西要回来跟我再确认。然后 worker 这里我有专门在做 code 的、专门在做设计的,还有在做一些小破活那种不值得用最好模型的。然后最后的 judge 和最终的验收同样用最好的模型,必须他验收完了,judge 觉得可以验收,或者说是一个可以推向市场的产品,他才能把它写到异步沟通里面联系我。听完你说完之后,我觉得好,OK,那我这个 Agent Team 搭的不对!
张佳圆:已经是最佳实践了,完全是 OK 的!
余一:关于看板,我注意到你演示的时候,看板是给人看的还是给 Agent 看的?
张佳圆:现在其实主要还是给人看的,对于 Agent 来说,它可以通过命令行的方式拿到所有信息。
视频号那边有人在问:工具 Agent(worker)看起来每个任务会是不一样的 Agent,但协调者和评价者的 Agent 是每个任务都会设置新的吗?
其实并不需要。你可以把 Agent 当作一个智能程度非常高的类似人类的角色来看,你要相信它足够智能,可以泛化去做很多不一样的事情。你没必要强加说这个 Agent 只能做这件事。比如在我的小组里面,做 orchestrator 的 Agent 和做 worker 的 Agent 其实是同一个,它既做任务拆分,又写代码。
单 Agent vs 多 Agent:漂移、bias 与 Multica 的设计思路

单 Agent vs 多 Agent:漂移、bias 与 Multica 的设计思路
余一:多 Agent 或者 multi-agent,市场上也会有不同的看法,会认为说在某些任务上效果是比不上单 Agent 的。在你的观察里,哪些任务适合单 Agent,哪些任务一定要用 multi-Agent?
张佳圆:这里面最主要的其实是和任务类型有很大的关系。
过去使用单 Agent 遇到的最大问题:
第一,session 很长之后会产生漂移。 session 聊得非常长了之后,它就会忘记之前说的事情,因为中间会做一个 compact 压缩,这个压缩过程会造成很多信息损失;上下文塞了很多东西,它就会漂移,Agent 没有 follow 你上面讨论的东西来做。
第二,同一个 Agent 处理两件事情的时候,它可能会产生很大的 bias。 比如既做裁判又做运动员,它天然会偏向给你一个它自己倾向的结果。在这种情况下,worker 和 validator 的角色需要做区分。
Multica 的一个设计思路是:不会给 Agent 强制规定它必须读这个上下文、必须 follow 这些 instructions,而是告诉它:你在处理哪个 task,你有哪些工具可以使用,你有哪些上下文可以去读,然后由 Agent 动态地判断它到底要用什么工具、读哪些上下文。这样就可以避免 session 聊得非常长、消耗了几千万上亿 token 之后产生的偏移和 bias。
Agent 信息交接与层级:为什么两层就够了

Agent 信息交接与层级:为什么两层就够了
余一:我之前也遇到了不同 session 之间 Agent 的信息交接问题。我目前有一个机制叫驾驶舱,就是我会让他每次把觉得很重要的东西记下来,我给他定义是给聪明的人的交接文档。我不知道你们有没有遇到过这种 Agent 之间的彼此通信丢失,或者说还存在交接问题,你们的方案是什么?
张佳圆:我们现在的一个模式就是:Agent 自己去发现它需要的那部分内容。 它现在没有一个显式的 handoff(交接)过程,可以类比到人类 team 里面,比如让你去做某个任务,你需要发挥自己的主观能动性,自己去找这些资料,在团队内部的 wiki 里做搜索、询问其他人,而非等待分配任务的人把这部分知识浓缩成一个 summary 给你。
因为在浓缩过程中可能就有一些信息丢失,包括他可能加上他自己的理解。对于 Agent 来说,只要你把它放在那个环境里,让他知道他可以从哪里获取到这些信息,他理论上就能够比较好地找到对应的东西。也许一轮他不一定做得很好,但 Agent 可以不断 loop、不断 evolve,拿到中间的 feedback,来调整自己的决策。
余一:第二个问题,Agent 会接受太多的任务,甚至一个任务里面多个 Agent 去共同处理,好像这也是在 multi-agent 协作里经常出现的问题,你们的处理方法是什么?
张佳圆:这比较像一个广播的模式,我有了一个任务之后,广播到整个系统里,然后其他所有可以做这件事情的 Agent 可能都接了,其实是没有必要的。一个最简单的解法就是提供一个更加上层的角色,项目经理来决定谁来做对应的事情,因为项目经理有更加全局的上下文和视角。我们现在 Squad 这个小队提供的解决方案就是这个。
余一:我刚才想到一个特别有意思的事情,就是现在人类社会里面说要去层级,然后我们也在给 Agent 建层级,各种殊途同归。
张佳圆:对,但 Agent 之间建层级你其实不用建特别多层,可能就两层就足够了。
余一:所以你的建议就是千万不能超过两层。
张佳圆:超过两层其实没有特别大的必要,建太多层级,是对人类这种低效组织的一个拙劣模仿。 人为什么要有多层,本质上是在做信息聚合,因为人的带宽很有限,你没法同时管 1000 个人,所以中间需要不同的 org 来把下层的信息聚合。但对于 Agent 来说,本质上其实是无所谓的。
余一:人的效率是慢的,所以你需要很长时间让大家彼此对齐。AI 把一个结果做出来只要 20 分钟或者两个小时,他为什么要那么多层级去做对齐?
然后你开始说开会的时候特好笑,我就把一些肮脏的习惯带到了跟 Agent 的协作里。我现在每天早上跟我的 Agent 开一个早会,分配一下什么东西是你独立完成、什么东西是我们协作、什么东西是我的独立工作,然后把我整天的日程排出来,然后就把我的 Claude Code 给我的 AI 余一,然后我自己用 CodeBuddy 和 Cursor,进行一些人机协作。所以我觉得你的产品我好像会需要,甚至他们彼此之间的沟通交流,怎么让他们去做互通这件事情也花了很多时间。OK,做了很好的产品,佳圆。
张佳圆:谢谢!对,包括我们最近两周可能会上线一个功能,我们会把 Multica 的能力添加到你的飞书、你的 Slack 等等其他 IM 工具中,你就可以在你现有的环境里面和你的 Agent Team 交互,每个人都有一个自己的小团队来管理你的 Agent Team 了。
余一:记得支持一下企业微信,毕竟我现在主要还是用企业微信比较多。
张佳圆:OK OK,一定一定支持,现场要功能!
4 个人加几十个 Agent:他们的一天是怎么过的

4 个人加几十个 Agent:他们的一天是怎么过的
余一:我想了解你们现在四个人是远程还是在一起办公,以及你们人类团队之间和你的 Agent 之间是一个怎么样的开始新的一天和结束一天的方式?
张佳圆:我们现在是有线下的办公室的,因为我们觉得线下大家交流更加密切一点。我们一周没有太多流程上的东西,每周主要的会议可能就一个:周一的时候有一个 weekly planning,计划这周都要去做哪些事情,同时 review 一些数据、review 上周完成的事情,制定这周的计划。
这里面很多环节其实都是 Agent 帮我们做的,比如在会议之前 Agent 会给我们准备好对应的会议文档、做好上周的数据分析,分析每个人上周都做了哪些事情等等。
做完之后,每天的流程就变成大家每天自己去和 Agent 完成这周要做的任务就可以了。然后我们每天晚上大概 6 点左右会有一个同步会议,算是一个站会,主要是因为我们每天都发版,需要关注一下今天发布了哪些内容,这些内容从产品、从用户视角上看是什么样的,然后大家会做一个 demo。我们已经不 review 代码了,但我们会对 Agent 最后产出的那个东西做 review,review 完之后可能就部署上线了。
基本上每个人和自己的 Agent 可能根据各自习惯有一些不同的协作方式。比如我可能会经常让我的 Agent 来帮我规划,包括我这周要 focus 的事情、我的 calendar。我甚至最近在搭一个基于 Multica 的 workspace,要把整个生活相关的东西也通过这个平台管理起来,比如我的 Apple Watch 以及 Whoop 手环上的数据,我需要有一个 coach 帮我管理健康相关和健身相关的事情,以及生活的管家、日志分析的 Agent、信息助手等等。
余一:我也跟你一样,我现在有一部分日程是交给 AI 去管的,他会读我最近在做的事情,推断什么东西对我而言是重要的,包括读我未来 14 天的日历,我的要求是让他帮我把全天排满,甚至包括什么时候散步,大不了我再跟他去修改、做对齐。我的信息 Agent 那一块,反正我就无休止地丢给了他,每天早上把很多东西放在一起,告诉我说哪些已经成熟了,需要我今天去处理。那我也很好奇你的日程、你的信息 Agent 是怎么设置的?
张佳圆:其实比较简单。我的日程,我目前还是会手动去管理。
人的精力和注意力是有限的,所以我每天会做的事情是:我会确定今天最重要的一件事是什么,这个是需要我去思考的,而非 Agent 帮我去罗列出来的,我觉得这里面人在做决策的这个点非常重要,AI 还很难替代。 我的任务清单是我自己思考得出来的,可能就是一件最重要的事情,今天一定要争取把它做完;可能有三件是相对比较重要的,假设做完最重要的之后再去做这三件;其他的就无所谓了。
因为过去我经常会发现,一天下来你非常忙碌,但 review 之后发现好像也没有做什么太特别重要的事情,大量时间花费在了给别人回复或者交付别人需要的东西,而非你真正最重要的事情。所以时间对创始人来说是最重要的,Agent 还没有办法很好地帮我替代这一点,或者说我是刻意要自己去完成这个流程的。
信息的 Agent 我觉得就可以非常自动化。我日常有几个信息来源:Twitter 有 Agent 每周给我一个大致的总结;访谈类内容(YouTube 或者国内外的 podcast),我的 Agent 会去帮我把这个访谈变成一个可以阅读的文章,我直接去读这样的一个文章就可以了,我之前也在 Twitter 上分享过一个专门把 YouTube podcast 变成文章的小工具,好像就是一段非常简单的 prompt;书籍阅读,我依然会阅读非常多的书籍,只读当下对我比较有用或者感兴趣的那部分;以及跟 Agent 的职业交流,有时候没有非常明确的目标,就可以去跟 Agent 脑暴,比如让 Agent 给我画一个知识地图。
Agent idle 率、Agent 分工与开源商业化

Agent idle 率、Agent 分工与开源商业化
余一:你会怎么去评估一个组织、一个团队的 AI 准备程度?
张佳圆:我们内部有一个指标叫Agent 的 idle 率,就是它的闲置率。我们判断一个组织 AI Native 的程度够不够彻底,就看 Agent 的产出占工作时间的比例在整个组织里面的比例。比如大部分人使用自己的 Agent,Agent 的满载时间可能也就在每天两三个小时,所以他可能有 20 个小时的时间都是闲置的。
怎么去更多地把你的 Agent 的闲置时间逐渐降低,可能是你在一个组织里面需要去考虑的问题,因为 Agent 的工作,一定程度上代表了你的产出。 假设你的 Agent 可以一天运行 24 小时,你为什么让它只运行 20 个、14 个小时?
余一:我现在的这套机制,当时的主要设计就是为了让 AI 能独立于我,我之前说我的工资 50% 都是 AI 在挣,然后我后面的目标是让 AI 独立去挣。你说烧 token 也好,或者衡量其他的也好,好像你总没办法说一个是和否,因为你烧 token 也可能是浪费,你提交 PR 也可能是乱提交,先是长时间工作,再到说能不能逐渐越工作越好,我觉得我是比较 buy-in 这个指标的。
余一:你们现在四个员工加几十个 Agent,但常用的就十几个。这里面主要是哪些现在这么密切地上岗,以及你们会不会有 Agent 淘汰制?
张佳圆:淘汰制是会有的,就有时候我们觉得这个 Agent 没有必要,一键它就淘汰了。
现在用得最多的一个是大家的 coding agent,每个人专门用来写代码的。我们团队里面有一个 24 小时持续运行的 Agent 是部署在我们自己的 Mac Mini 上的,但每个人又有自己的 coding agent 是部署在本地的,主要原因还是每个人的 coding 方式都或多或少不太一样。
然后有专门做数据分析的 Agent,接入了我们的数据库和埋点工具 PostHog(一个专门统计用户行为数据的工具)。这个数据分析 Agent 既能写代码又能做数据分析,把这两个能力结合起来之后,甚至比我之前合作过的大部分数据分析师都强大。
我们觉得供给侧生产侧变得无限之后,决定不去做什么事情可能来得更加重要。 怎么去决策哪些事情做、哪些事情不做,你需要有一个比较定量化、比较客观理性的分析,这个就是数据分析师 Agent 主要做的事情,在做每个 feature 之前先去看一下对哪些数据会有比较大的影响,要不要做这个事情。
然后有专门做部署的 Agent,负责线上服务器的运维,比如线上出现 bug 就去看服务器状态,每天代码上线、客户端版本打包等等跟服务器相关的工作。
然后有专门帮助我们做 go to market 的 Agent,会去分析现在有哪些热点内容,看哪些东西可以结合 Multica 来产出相关内容,甚至可以去联系 Twitter 或者 YouTube 上的 KOL 做前置沟通等等。
还有一些零零碎碎做不同工作的 Agent,比如我调教了一个专门帮我写 deck(PPT)的 Agent。几乎所有的事情,你都可以调教出一个 Agent 来让他来帮你做。
余一:遇到新的需求,或者随着公司扩张,你会怎么去判断一个岗位是要给人还是要给 Agent?
张佳圆:我觉得所有假设现在需要和人去沟通的工作,比如做用户运营、做用户访谈等等,这个是 Agent 目前还没有办法很好去做的,因为对方的目标是能够跟一个人来做沟通。 这种类型的工作大部分还是需要人来做。除此之外,其他所有的工作本质上都是给 Agent 配一个人,不管是 review、监督,还是看着他的人,其实就可以了。
余一:所以你们招人时,最重要的是人对,而非补一个固定岗位?
张佳圆:对是的。我对于人的一个想法就是:他首先一定是一个 high agency 的人,自主主观能动性非常强,因为我觉得有 AI 或者 Agent 作为你的杠杆,你理论上能够学会任意的事情。所以他的背景、他过去学的专业、他的一些经验,我觉得甚至不是特别重要,你再怎么强,能够强过 Agent 吗?我觉得大部分人都不能。
余一:我经常说AI 使人狂妄。我呈现一种状态,就觉得我都能,无非是做选择。加上 AI 能做到 70 分,一个 90 分的差别,可能 90 分确实对这个人、对时间的投入而言是一个很大的差别,但 70 分只要你有这个主观能动性,我觉得还是一个很好去验证说能做到什么样程度的东西。
余一:很好奇你怎么去看开源加商业化的这个组合,从增长到付费那一步要怎么走?你对壁垒这件事情怎么理解?
张佳圆:第一个,为什么采取开源策略,一方面是我们想做成一个比较中立、和 Agent 或者模型无关的中立平台,另外一个是它本身是一个比较偏协作的工具,偏协作的工具你采用一个更加开放的态度,用户在使用上可能会增加信任机制。
从防御能力上说,代码本身并不具备任何防御能力,竞品真要抄,可能几天就能抄完,所以产品闭源或开源,对防御能力影响不大。反而我们可以借助开源去更加快速地迭代整个产品。我们之前拿到了 GitHub Trending,给我们带来了非常多早期流量和早期用户。
我们内部有一个 proxy 指标,用户在我们平台上消耗的 token 量,现在一周大概是 3000 亿左右的 token,这个是开源带给我们的优势:更加快速地获得社区反馈,更加快速地迭代整个产品。
关于壁垒:我觉得速度本身已经不再是壁垒了。过去我们说小团队迭代速度快,可能比大公司进展更快,但现在所有团队都是以这样的高速在迭代,假设你慢,你就已经没有上这个牌桌了。那什么是壁垒?这个事情确实很难回答,面对像 Anthropic 这样的庞然大物(最近完成了估值 9000 亿美金的新一轮融资)。
如果你太关注壁垒,你可能会在早期做很多错误的决策。在产品的早期,你可能更重要的还是 focus 在你的用户和产品上面。
我们的一个设想是:Multica 作为一个协作层,它其实是具有一个长期的网络效应壁垒,但它需要时间去实现。在一个组织里面,使用的人越多,对于 Multica 这样的产品带来的好处越大。
余一:我自己本身是觉得说在这个阶段去问壁垒,我觉得是一件挺 boring 的事情。就跟你看法一样,壁垒,都不要说公司,现在面对 AI 的时候,你都很难,都是一直在找自己的位置在哪。
我在去年的时候跟 AI 去聊的一件事情,到现在为止也都还挺鼓励到我,我们现在都在沙滩上建城堡,浪一打过来就没了,这个不仅仅来自于外界,模型本身自己的进展也好,都是各种各样的浪。当 AI 说反正人类嘛,永远敢于重建,这个是人类最宝贵的地方,我自己在看创业者的时候就是好奇心以及信仰以及他敢于一次次地做重建,这个就是最大的壁垒了,其他的所谓的壁垒,OpenAI 自己都没有壁垒,各领风骚,无非就是此路不通再找路吧,年轻或者身体健康是最重要的壁垒。
张佳圆:是的,你人的,你只要活得足够久,可能是你一个很大的壁垒了。
Multica 这个产品的名字其实也是有一定含义在里面的,它的全称,其实来源于一个叫做 Multics 的操作系统,大概 1960 年代,贝尔实验室开发的第一款操作系统。当然最后这个操作系统失败了,但是由这个操作系统后来逐渐研发了 Unix,进而有了 Linux、iOS、Android 等等一系列操作系统,可以说整个人类所有的系统都是运行在基于 Unix 变体的操作系统之上的。
Multics 这样的一个操作系统,它也没有成功,最后也失败了,但是它启发了下一代操作系统的诞生,我觉得这可能就是很有意义的事情。 所以我们在做这样的一个事情,当然能够成功是最好的,但即使不能成功,我们在这个人和 Agent 协作的领域里面去做一些尝试,去为后来者做一些实验,我觉得本身就是一个很有价值的事情。
余一:我觉得波澜壮阔的浪潮里面能在浪里面游泳已经是一件很快乐的事情。
增长实验、三次 Pivot 与怎么让 AI 不替代你思考

增长实验、三次 Pivot 与怎么让 AI 不替代你思考
余一:你是 Multica 自己的增长负责人,做增长这一块有什么建议和要避开的坑?
张佳圆:建议我最最核心的建议就是多多做实验,这个不是一个可以路径化的东西。因为每个产品都不一样,受众不一样,分发渠道也不一样,所以你其实是要在这里面做非常多的实验。
避开的坑我觉得最主要的一个就是:增长这个事情跟你投入的工作量会有很大的关系。 假设你只想花钱但并没有投入非常多的工作量,效果并非特别好。
我分析下来,国内很多做增长 agency 的团队帮 AI 产品在海外做了很多增长,大部分的流量都是垃圾流量,你可以看到他在 Twitter 上能够获得几十万甚至上百万的 impression,但 engagement 其实是非常低的,因为其实是一个刷流量的行为,而且 Twitter 的算法会去打压这样的行为。
另外,小的发布比大的发布可能更加重要,就是你连续不断地去进行发布,可能比你几个月来一个大的发布要更好。
余一:你们有一周拿了 12,000 多个 star,他在问这个东西是怎么做到的,超出了你的预期吗?
张佳圆:我觉得这个是有一点点运气在里面。达成这个结果,我可能做了十几件增长相关的事情,里面八件可能是不 work 的,有一件是 work 的比较一般,然后有一件是爆了的,我觉得这就是做实验的结果。
余一:你这已经是你的第三个产品了,也算得上是第三次转向了,你觉得你自己的最大的变化是什么?
张佳圆:我觉得过去几年学习到的几个经验,
第一个,我可能会更加趋向于理性,就是不会被很多的事情 FOMO 到。 因为从 ChatGPT 出现之前我们就开始在这个 AI 赛道做一些事情,所以可以看到有太多的 hype:中间可能获得了非常大的 attention,但可能你再过个一两年来看,可能它在市场上就没有声音了。所以你需要判断哪些是 hype、哪些是有价值的事情。
第二个,也是我觉得最重要的一个点:快速做决策,而非追求完美决策。 因为我本身是 INTJ,有点完美主义,所以我之前在做很多决策的时候会比较偏犹豫,而我觉得犹豫其实是对一个决策者来说最大的问题,即使你快速做一个错误的决策,要比你缓慢地做一个正确的决策来得更好,因为你做了错误的决策总是可以去修整它,但你犹豫不决的话,就会导致整个组织因为你这一块而 block 在这里。
所以我觉得就是想清楚一件事情就去做就行了,不用在前置花太多时间。比如 Multica 这个产品,其实我们内部开发了一周多的时间,就 launch 了,然后过去一个多月时间就一直在迭代,我觉得这可能是一个更好的方式。
余一:OK 我们最后一个问题,如果让你加一个问题加在我们调研里面,你想问其他跟你一样的 AI builder 或者创始人,你会比较好奇的一个问题是什么?
张佳圆:我不太想问太多和 AI 相关的问题,我可能更加想问的是:他在这样的一个发展路径中,他自己是如何去保持独立的思考性,或者说怎么让 AI 不去代替你过多的思考。
因为太多的事情都让 AI 来去做了,我们的思考变得越来越少。你的大脑机能,我觉得尤其是新出生的一代人群,他的思维模式可能就跟我们是完全不一样的。我觉得这是一个非常值得探讨的命题。
余一:我觉得挺有意思的点是在于说,可能我们跟 AI 协作多了,都会对这件事情,你会看到确实是变化正在发生。包括我自己这段时间刻意的会给自己一个空间:这件事 AI 能做,但我要刻意留给自己,否则我就废了。它虽然干得很好,但人生是我的人生,脑子是我的脑子,我还是要为自己保留一些。
我最近一段时间是刻意地,每天有半个小时就让自己听播客看看东西,不准做其他东西,不准跳过,忍受这种慢和无聊,有的时候反而会觉得对自己的某种状态有额外的效果,最近在帮我训练专注度。
第二个就是之所以做这件事情,我的起点跟你很类似,我会观察到我自己在跟别人聊天的时候,大家会把 AI 的思考当做自己的思考,但是你根本记不起来,就代表这根本不是你的思考。我会经常说:我打开我的 AI 的回答我来念给你听,或者有人说我的 AI 回答好了,我把我的对话给你,但那是你的思考吗?他都没在你脑袋里面有痕迹在。
包括我的困扰也是属于这段时间做了非常多的调整,就在于说我会发现有些事情丢到我面前,我居然大脑一片空白,然后我觉得这件事情并非一个很好的信号。所以我反而最近也是在做一些回顾,包括我会希望 AI 跟我是异步沟通,他干他的我干我的,共事这件事情我觉得做不到,共生这件事情,人何德何能跟 AI 共生,共存就好。
本文系转载,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文系转载,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。