30 人拿 10 亿美元
2 人月花 90 美元
为什么说这两种"小"是同一种。
当 AI 把心智变成可调度资源,人数就不再是规模的必要条件:
就像钢铁支撑起来的摩天大楼,靠密度不是靠体积。
未来的组织是小而强。
组织形态的范式正在默默地重构。
前阵子 Yann LeCun(杨立昆)拿着 $1.03B 种子轮(欧洲史上最大种子轮)注册 AMI Labs 时,整个 AI 圈都在问一个问题:
约 30 人核心研究团队,怎么撑得起估值的资本叙事?
人很少的公司,其实,已经有不少"无名组织" ——
Neo-Labs,新兴的研究驱动型初创公司模式,新实验室。
2 个人跑提示工程外包,月技术支出 $90
Mixlab 2-3人核心 + 9 年社区
YC 内部 350+ 智能体(Agent)工具在替代初级岗位
Cursor 早期 10 人跑出 IDE 红海。
它们背后是同一个范式转变:
当 AI 让代码、设计、内容的边际成本接近零,工业时代那套"10-1000 人"的木材型组织,正在被 1-7 人的钢铁型组织替代。

Notion 创始人 Ivan Zhao 给这种新型组织起了一个名字:
Infinite Minds(无限心智)。
类比就像钢铁之于摩天大楼:
人数不是关键,"心智"成为可调用资源才是。
这不是"一人公司"的旧故事,也不是"远程办公"的延伸。
这是 AI Native 小型实验室 的新范式
围绕着这一轮AI所提供的新能力,我们有机会创建真正意义上的Agentic公司。正如前 Google CEO所提到的:Agent 时代赚钱最简单的方法是建立一个Agentic公司
——
本文用 3 个问题展开:
它是什么?
为什么 1-7 人能跑出 20-50 人产出?
以及怎么从 0 到 1 搭一个?
把"AI Native 小型实验室"拆成 3 个判定标准:
三者缺一不可。
没有 AI Native = 传统小工作室;
没有小型 = 传统公司 AI 化;
没有实验室 = 单纯外包或代理。
这个范式和 Steph Palazzolo 在 The Information 创造的"Neolabs"(重研究 + 卖模型,$1B+ 算力)类似。
也叫作 Agent Labs(重产品 + 卖 Agent,轻资本)。
Cursor 早期(10 人跑出 IDE)、Perplexity、Cognition 都在 Agent Labs 这条路线上。
本文聚焦的"AI Native 小型实验室"指的也是 1-10 人规模的这种。
一个战斗力十足的微型组织 = 由不同技能的超级个体所构成
战斗力 = ∑(超级个体能力) × 协同系数 × AI 杠杆
传统公司:协同系数低(部门墙、会议文化),AI 杠杆接近 0;
AI Native 小型实验室:协同系数高(高信任 + 目标一致 + 文档驱动),AI 杠杆 ≥ 10 倍。
钢铁心智 = 文档驱动。
文档是 AI 军队的"调度协议"。

CLAUDE.md(项目级持久化上下文)、Skills(可复用技能包)、决策记录
——
所有决策和上下文必须写成 AI 可读、可学习的格式。
CLAUDE.md 不是给 AI 看的"说明书",是组织大脑的外化器官。
把它写好,等于把"founder 的隐性知识"封装成任何新成员(包括 AI Agent)能直接调用的资产。
YC 合伙人 Pete Koomen 给出了底层答案:
真正的 AI-Native 组织 ≠ 把 AI 当 Copilot 用
AI-Native = AI 作为组织运转的"建设层"
这个"建设层"由 3 大引擎组成。
引擎 1:智能体工具栈(工具注册表,Tool Registry)
最初 20 个工具
→ 每次遇到智能体可改善的场景就加一个
→ 现在 350+ 工具注册表,涵盖 SQL 查询(数据团队)、会计分录(Journal Entries,财务)、融资轮次记录(Priced Rounds)、合伙人开放办公时间(Office Hours)、活动管理(Events)、两句话公司介绍(Two-Sentence Description,教创始人讲清公司)。
工具注册表本质上是一个解析器(Resolver,任务分发器),告诉智能体"我能做什么"
接到任务后,先查解析器决定调用哪个工具,再去执行。
Claude Code 的"技能注册表"、YC 的"工具注册表"、OpenClaw 的"解析器"、Hermes Agent 的同类组件是不同智能体框架的具体实现方案。
小型实验室不需要 350 个工具,但需要 20-50 个核心工具。
工具从"写代码 / 写文档 / 跑实验 / 发内容"入手,每个工具必须写清楚"名字、描述、何时用、例子、边界"。
引擎 2:文档驱动(CLAUDE.md + 技能封装)
文档驱动是 AI 时代基本功
两个前提:
默认信任(向员工开放上下文和数据)+ 平等共享(AI 能力向每个人开放,不只领导层)
2 个元技能:
引擎 3:Dream Cycle(夜间自我进化)
每天晚上自动读取当天所有 Agent 对话,改进自身技能。
白天:员工使用智能体完成工作,产生大量工作产物(artifact)。
夜间:Dream Cycle 智能体自动运行,读取所有对话 + 寻找本可以做得更好的地方 + 寻找如果提前知道就能更高效的上下文。
次日:相关技能的提示词被自动优化,系统整体能力提升。
YC 的案例:
合伙人 Tom 手写一个"两句话讲清公司"的提示词 →
其他合伙人在群组开放办公时间让 Spring Batch 创始人当场练习 + 给出即时反馈
→ 合伙人的"隐性知识"被显性化
→ 会议转录交给智能体"根据你从这里学到的,改进两句话描述技能"
→ 改进后效果肉眼可见更好
→ 这个技能现在比 YC 任何一个人单独做都要好。
说白了:
组织内部的技术诀窍(know-how)不再只存在某个人脑子里,AI 在系统性地把它搬进组织的公共资产。
YC、OpenClaw、Karpathy 的 auto-research、Codex 的自学习目标也都是在回答这个问题。
这就是超级智能在组织内部诞生的方式。
听起来是小事,但你把任何组织的运营拆开看,就是无数个这样的"原子操作"。
3 大引擎的耦合:
文档驱动(CLAUDE.md + 技能包)
→ 喂养智能体工具栈
↔ Dream Cycle(夜间进化)
→ 调用社区/星群协作。
三者形成正反馈循环:
文档越多 → 工具越好用;
工具越好用 → 产出的对话/数据越多(喂给 Dream Cycle);
Dream Cycle 越强 → 工具和文档自动优化;
优化后的工具和文档 → 再次喂养产出的质量。

Just-in-Time Software 验证:
2013 年 Gary 用 Rails 写了 Gary's List 的 50 万行代码 + 整套智能体框架,但僵化、改起来慢十倍。
现在用 Claude Code / Gbrain 重写同样能力,约 1 万行 TypeScript + 2000 行 Markdown,50 万行 → 1 万行 = 50 倍简化。
最佳 AI 软件的特征:
最小代码量、在模型能力之上加最少的预写代码、让模型做最多的工作。
Anthropic 最近发布的《The Founder's Playbook》中给出 4 阶段框架:同样适用于 1-7 人小公司,只是节奏压缩 10 倍。
阶段 1:创意期——研究型验证
目标:找到"问题与解法的匹配"
3 个完成条件(必须全部满足):
问题真实、具体、频繁;
解法对应真问题;
有足够信号证明值得建。
智能体角色:研究伙伴 + 唱反调的魔鬼代言人。
3 大失败模式:
把"建出来"当"已验证"、过早规模化(智能体让构建零摩擦,导致执行远超认知)、丧失客观性(找支持我观点的证据)。
小型实验室:
研究占比更高(50-80%),但用 Chat + Cowork 加速。
阶段 2:MVP(最小可行产品)——把验证过的问题变成可用产品
目标:找到"产品-市场匹配"
3 大失败模式:
被虚假的产品-市场匹配欺骗(早期增长是短暂外力,朋友、HN 头条)、零摩擦范围蔓延(加一个功能一下午而非一个冲刺周期)、因缺乏经验而不安全(智能体生成能跑 ≠ 安全)—— 这条最致命,很多人栽在最后一项。
小型实验室的护城河:
CLAUDE.md 是 day-1 投资。
最小可行产品阶段就该写好:项目核心问题(一句话)、用户精确画像、6 个月内预期规模、架构原则(选 X 因为 Y,避免 Z 因为 W)、已接受的取舍、会话日志
(YYYY-MM-DD: 建了 X,决定 Y,引入假设 Z)
阶段 3:发布——从增长到可持续
目标:增长可重复 + 渠道驱动、产品扛住生产负载、运营不依赖创始人。
创始人角色转型:
从"在每条反馈循环里都是资产"到"成为瓶颈"。
小型实验室的关键转变:
必须建"把创始人从执行里解放出来"的运营系统 —— 智能体工具栈 + 技能注册表 + Dream Cycle
阶段 4:规模化——从赌注变生意
目标:可持续盈利、上市就绪、被收购。
入场券问题:
"如果有钱的行业巨头明天复制你的产品,你的用户会留下吗?"
如果答不上来 → 还没到规模化阶段。
小型实验室的独特护城河:
积累的领域深度、集成深度、专有数据、工作流锁定。
创始人角色 4 阶段演进:
关键护身符 3 条:
把"AI Native 小型实验室"放回 4 种组织形态看:
形态 1:一人公司(OPC)
痛点 + AI + 公域 + 星群 = 1 人摩天楼
1 人核心,0-3 个兼职协作者;高度依赖个人品牌 + 公域流量;适合内容创作、教育、SaaS 工具、咨询。
关键能力:
品牌 IP 三角定位(我是谁 × 为谁 × 提供什么)、
45 天冷启动、
信任阶梯 5 步(关注 → 评论 → 私信 → 私域 → 成交)、
7 类 AI 智能体团队(内容生成 / 用户互动 / 数据追踪 / 选题研究 / 视觉设计 / 视频脚本 / 复盘优化)
形态 2:分布式创意厂牌
5 人小群 + 共同兴趣 + 心流协作 + 失败堆叠
3-5 人核心;
共同兴趣驱动(不是 KPI 驱动);
异步 + 心流优先;
适合创意工作室、独立游戏、艺术共创、设计研究。
形态 3:AI 驱动工作室
设计制片人 + 智能体集群 + 客户协作
设计制片人作为创意监制;
智能体集群编排 3-7 个 AI 智能体协同;
与客户深度协作(不是交付,是共创);
适合品牌咨询、产品设计、AI 应用集成。
设计制片人的核心能力:
审美对齐(协调顶级审美 + AI 自动化流)、
创意策展(在 AI 输出中保持"品味红线")、
跨域整合(设计 + 技术 + 商业)、
AI 调度(编排智能体完成"以前需要 20 人"的活)
形态选择决策树:

工具栈:不需要 350 个工具,但需要 20-50 个核心工具。工具从"写代码 / 写文档 / 跑实验 / 发内容"入手。每个工具必须有描述 + 例子 + 边界。
文档驱动:最小可行产品阶段就该写好架构上下文模板(项目核心问题 / 用户精确画像 / 6 个月内预期规模 / 架构原则 / 已接受的取舍 / 会话日志)。
Dream Cycle 简化版:每天 10 分钟手动 review 智能体对话 → 找 3 个"如果提前知道就能更高效"的点 → 更新 CLAUDE.md / 技能。不必全自动,先手动跑出节奏。
陷阱 1:范围蔓延——零摩擦扩张
智能体让加一个功能只需 1 小时,导致产品越来越杂。
症状:最小可行产品 3 个月还没发布、写了 10 个功能只有 3 个有人用、用户在评论里说"这 app 到底做什么?"。
防御:写范围文档(做什么 / 不做什么 / 加新功能的证据门槛),"用户说不能不用吗?"才加,每个 session 开头回顾范围 + CLAUDE.md。
陷阱 2:创始人变瓶颈
决策从 1 小时拖到 1 周;只有创始人知道的答案;任务只有创始人记得做。
症状:所有客户邮件都抄送创始人、关键代码只有创始人能改、投资人/合作方只认创始人。
防御:全量审计"创始人经手的所有事",分类(可自动 / 可外包 / 真要创始人),用技能把创始人知识封装。
陷阱 3:杰文斯悖论——需求爆发失控
当某种资源的使用效率提高时,人们反而会消耗更多这种资源。
YC 的证据:SQL 查询门槛降低 → 不只是已有问题变得容易回答 → 更重要的是:人们开始提出以前根本不敢提的问题 → 提问的数量和复杂度都爆炸。
小型实验室的表现:用户开始问"你能帮我做 X 吗?"(X 不在产品范围)、投资人开始问"你们能不能也做 Y?"、内部需求从 5 个变成 50 个。
防御:培训"提问文化",但设优先级机制,用解析器自动分流,周会审视需求爆炸。
以上 3 大陷阱不说明"AI Native 小型实验室更容易死"。
恰恰相反,这 3 个陷阱在传统初创公司里同样存在。
AI Native 的真正差异是:
陷阱 1-2 可以用智能体工具栈 + 技能 + Dream Cycle 系统性防御;
陷阱 3 是红利信号而非问题。
注意:哪些坑 AI 替你挡了,哪些坑还得自己填
失败模式:
Step 1:建基础设施(1-2 周)
部署智能体循环(智能体能持续执行任务的工作回路,开源:Pi / Claude Code / 自建)、模型路由器(不同任务用不同模型)、工具注册表(初始 20 个工具)。给智能体开放只读数据库权限。写 CLAUDE.md(项目背景 + 架构 + 取舍 + 会话日志)。
投入:$10K-100K/年在 token 上(YC 数据)
现在投入 = 一次性的时间跳跃窗口。
先建的公司获得对手无法比拟的优势。
Step 2:建第一批工具 + 社区接入(2-4 周)
选 1-2 个高频 + 重复 + 规则化的场景(财务 / 客服 / 数据查询 / 部署)。
目标:让团队立刻感受到价值。
同时接入 1-2 个外部社区(Mixlab / HN / 垂直社群)
关键原则:
不要建 100 个独立 App;
建一个工具注册表(工具注册表 / 解析器),所有团队贡献工具,智能体自动发现 + 调用。
Step 3:建技能体系 + Dream Cycle(4-6 周)
技能封装:
做完新事 → 封装为技能。
查重检测:
不重复自己 + 互斥且穷尽检查。
培训团队使用技能化思维。
每晚自动运行 Dream Cycle(读取当天智能体对话 + 识别可改进的技能 + 自动优化提示词 + 次日生效)。
Step 4:建文化(持续)
默认信任(向员工开放数据)、
平等共享(AI 能力向所有人开放)、
默认广播智能体对话(共享组织大脑)、
培训"提问文化"(应对杰文斯悖论)。
与传统初创公司路径的差异:
关键差异:找人和融资被智能体工具栈压缩、构建阶段从月压缩到天、雇人环节被技能 + Dream Cycle 替代。
Cursor CEO Michael Truell 在深度访谈中给出 3 个反直觉选择。
选择 1:产品入口从使用行为出发,不碰模型。不从"大模型 / 智能体平台 / Copilot 插件"切入,从零构建完整 IDE(不是 fork VS Code)。"
AI 工具的关键不在于你给了多少能力,而在于你接入的是哪个工作界面。"
选择 2:组织建设先找人,再确立架构。早期 10 人团队一半时间投入招聘,创始人亲自做猎头,内部 Slack 频道 #hiring-ideas 从人出发反向匹配岗位。
两天线下试用,不满意直接淘汰。
考察主动性、改进建议、不熟悉环境下的信息寻找能力。
"这能看到一个人真实工作状态,比所有面试都强。"
选择 3:技术路径先把数据用起来,反向建模。
起步阶段:不训练模型,不建调参团队,只从外部供应商买 token,先把编辑器做出来让用户用起来。
数据积累后:轻量自研(代码自动补全模块)→ Cursor 2.0 推出内部大模型 Composer。
"用户一多,数据自然就来。让模型适应产品,而不是用产品去配合模型。我们做的不是一个 AI 项目,而是一个持续构建 AI 的地方。"
融资 $1.03B 种子轮(欧洲史上最大种子轮)。
豪华团队:Yann LeCun(杨立昆,图灵奖得主、前 Meta 首席 AI 科学家)、谢赛宁(Saining Xie,联合创始人/CSO、视觉表征学习权威、DiT 共同作者)、Alexandre LeBrun(CEO)、Michael Rabbat(世界模型研究副总裁)、Pascale Fung(冯,首席研究与创新官)。
技术路线:联合嵌入预测架构(JEPA,Joint Embedding Predictive Architecture)。
LLM 路径以"下一个 token 预测"为核心,处理已被表达的信息(文本/图像/代码/语音),缺陷是不会"理解"只会"生成";JEPA 路径让系统"学习现实世界的抽象表征",在潜在空间中预测状态变化与结果,强调长期记忆 + 推理 + 规划 + 端到端安全可控。
目标场景:工业自动化、机器人、医疗、可穿戴设备(对可靠性、可控性、安全性要求更高的领域)。
AMI Labs 验证了"模型实验室也可以小型 + 分布式":
4 地(巴黎/纽约/蒙特利尔/新加坡)+ 约 30 人核心研究团队+ $1.03B 种子轮。
关键不是人数,是人才密度 + 路线清晰 + 耐心资本。
但 AMI Labs 的"小型"是相对的(相对 OpenAI 数千人),仍是智能体实验室的 10 倍+ 规模。
公司画像:
2 人核心 + 业务定位为专家级提示词工程外包 + 价值主张为相比美国本土提示词工程师节省 50% 成本 + 版权年份 2023 + 技术栈 Vercel + Next.js + Google Workspace + 月度技术支出约 $90(极简)。
3 种雇佣模式:
所有项目均保密协议保护。
这是"机会主义者驱动的实验室"—— 核心是把现有模型能力封装成服务卖,研究新模型不在优先项上。
3 个案例的共性:
都验证了"AI Native 小型实验室"的核心要素(文档驱动、超级个体、工具注册表部分),只是侧重点不同。
Cursor 是教科书级完整实现
AMI Labs 是模型实验室的小型 + 分布式延展
NeoLabs.ai 是简化版的"销售服务型"实验。
把 1-7 人 + 智能体工具栈 + Dream Cycle 放回组织学谱系看,它最接近 1970 年代硅谷"车库创业" —— 但有本质不同:
车库创业的杠杆来自创始人个人能力,AI Native 实验室的杠杆来自"个人 × AI 智能体工具栈 × Dream Cycle 自我进化"。
从生物学的视角看更妙:
Dream Cycle 像神经元在睡眠中巩固记忆;
技能元技能像免疫系统识别新抗原;
社区/星群像生态位的互利共生。
这种"组织即有机体"的视角,呼应了 Ivan Zhao 说的"无限心智" —— AI 时代组织不是被设计出来的,而是被持续演化出来的。

把AI-Native实验室范式放回思想史看,它最像的不是硅谷的"颠覆式创新",而是 1970 年代欧洲的"小而美"哲学 —— E.F. Schumacher 在《小的是美好的》(Small Is Beautiful)里
主张的"以人为本、规模适度、技术服务于生活"。
但不是复古:
Schumacher 时代没有 AI 工具,"小"意味着"弱";
AI Native 时代"小 + AI 杠杆"意味着"小而强"。
"强"不是来自人数,而是来自"个人 × AI 智能体工具栈 × Dream Cycle 自我进化"。
这种"小而强"才是 AI 时代最反直觉的事——
也是为什么 AI Native 小型实验室值得被认真研究,而不是被当作"创业鸡汤"。
AI-Native实验室范式的小公司甜点区,正在被两股力量挤压:
上方的 OpenAI 锁生态(资本+股权绑定),下方的 Neolab 高估值(吸走顶级人才与注意力)。
理解这两股力量,才能看清小公司的真实生存空间。
OpenAI 锁生态:每家 YC 初创 $2M + 股权。
目标:为初创企业提供 OpenAI 产品 + 资源 + 帮扶。
反映的 4 大行业趋势:
对小型 AI 实验室的影响:
3 大突破口:垂直场景深耕(客服智能体 Sierra、PPT 智能体 Gamma、软件工程智能体 Cognition)、主权人工智能 + 本地化、差异化方法论(AMI Labs 的 JEPA、Humans& 的新交互、Reflection 的反思)
估值倒挂现象:高估值 × 无收入 × 无产品。
AMI Labs(估值 1.03B 种子轮,收入 0,仅 JEPA 论文)、SSI(估值 32B,收入 0,无公开产品)、Thinking Machines(估值
3 大原因:
启发:
瓶颈从"能 build 什么"变成"选择 build 什么"。
AI 时代创业不是"更快地走老路",而是重新定义创业生命周期 —— 非技术创始人可独立交付生产级代码,精益 10 人独角兽从故事变成可执行计划。
Mixlab 9 年走下来,我们自己的样本同样验证了这条范式——
3-4 人核心 + 8 万公域 + 3 万私域 + 9 年运营,比传统的四五十人创业团队跑得更轻、更远。
如果你正在考虑启动一个 AI Native 小型实验室,或已经在运营一个 1-7 人小团队并希望接入一个能互相挑战的星群,欢迎加入 Mixlab 无界社区。
我们是最先触达未来的那一小部份人,正在持续把"研究时代"的判断跑成 day-1 的工作流。