16 个项目，一个生态：OpenClaw 正在构建 AI Agent 的操作系统层

唐国梁Tommy

发布于 2026-06-25 21:33:51

1510

文章被收录于专栏：TGLTommyAI前沿技术论文TGLTommyAI前沿技术论文

近期解读了 OpenClaw 生态中的 16 个项目——从一颗 5 美元的 ESP32 芯片，到 NVIDIA 官方出品的企业级安全沙箱，再到香港大学的多 Agent 协作框架——研究下来，有一个判断难以回避：这可能是目前开源社区中，在 AI Agent 基础设施层野心最大、覆盖最广的一次系统性布局。

它不是一个项目，是一套 Agent OS

如果你只看过 OpenClaw 的主仓库，你大概会以为这是另一个 AI Agent 框架。但如果你把这 16 个项目摊开来看，你会看到一个截然不同的图景：一个试图覆盖 Agent 生命周期全链路的生态系统正在成形。

这 16 个项目可以粗略分为四个层次：运行时层（Agent 跑在哪里）、协作层（多个 Agent 怎么配合）、场景层（Agent 被部署到哪些具体场景）、基础设施层（谁来管、谁来演化）。

理解了这四层，你才能理解这个生态真正在做什么。

第一层：运行时的极端多样化

这个生态系统最让我惊讶的地方，不是功能有多强，而是它的运行环境覆盖有多宽。

MimiClaw 跑在一颗 5 美元的 ESP32-S3 上，纯 C 语言，7400 行代码，双核 Xtensa 架构。它支持 Telegram Bot、飞书 Bot、WebSocket，内置 ReAct 推理循环，能做工具调用、持久记忆、定时任务，甚至 GPIO 控制。这个项目的存在本身就是一个工程声明：一个具备完整 Agent 能力的系统，可以在 520KB SRAM 的设备上运行。

另一个极端是 QuantClaw——用 C++17 原生实现的 OpenClaw，996 个测试用例，57 个 WebSocket RPC 方法，支持 8 个以上的 LLM Provider，内置 BM25 记忆检索、动态迭代上限、三层故障转移。它同样追求极致，但方向是高并发和低内存占用，面向服务器端部署场景。

夹在这两者之间的，是 ClawX（Electron 桌面客户端）、LobsterAI（网易有道出品的个人助手桌面 App）、ClawPanel（Tauri + Rust 实现的可视化管理面板）、Poco（云端 Docker 沙箱执行平台）、Prismer（学术研究一体化 Web 平台）。

同一个 Agent 协议，从嵌入式 MCU 到桌面 App 到 Web 云平台，全部可以跑起来。这种覆盖范围，不是"我们支持多平台"那种营销说法，而是真的每个平台都有完整的、独立可用的实现。

这里值得单独说说 Prismer。它是 OpenAI Prism 的开源对标方案，37 个 Prisma 数据模型，Next.js 16 + React 19，集成了 Monaco Editor（LaTeX 写作）、PDF.js（论文阅读）、Jupyter Notebook（数据分析）、WebContainer API（浏览器内代码执行），还有引用验证引擎，能对照 arXiv、Semantic Scholar、CrossRef 逐条核实引文真实性。这是 OpenClaw 生态里工程完成度最高、最接近完整产品的项目之一。

第二层：多 Agent 协作的两种路径

当单 Agent 的能力边界触顶，系统就需要考虑多 Agent 协作。这个生态里有两个项目在做这件事，但思路完全不同。

ClawTeam 选择了极简主义：让 Agent 自己调 CLI 来组队。它不是"给人写编排代码的框架"，而是"给 AI Agent 用的 CLI 工具"。Leader Agent 调用 clawteam team spawn-team 创建团队，调用 clawteam task create 分配任务，Worker Agent 调用 clawteam task update --status completed 汇报完成。整个协调协议就是文件系统 + 命令行，没有数据库，没有消息队列，基于 git worktree 实现工作空间隔离。HKUDS（香港大学数据科学实验室）出品，仍在 Alpha 阶段，但概念验证已经展示了"8 个 Agent × 8 块 H100 × 2430 次实验"的实际使用场景。

HiClaw 走的是另一条路：把多 Agent 协作建在 Matrix 即时通讯协议上，配合 Higress AI 网关和 MinIO 对象存储，实现完整的 Manager-Workers 架构。所有 Agent 通信在 Matrix 房间里进行，人类全程可见可介入。更重要的是安全模型——每个 Worker 只持有 Higress 签发的消费者令牌，永远接触不到真实的 API Key 或 GitHub PAT。Higress 充当凭证保险箱，Worker 只是拿着"工牌"干活。这个设计对企业场景非常有价值：即使 Worker 被 Prompt Injection 攻击，攻击者也什么都拿不到。

两种路径各有适用场景：ClawTeam 适合技术用户快速搭建 Agent 流水线，HiClaw 更接近企业级部署时对安全性和可观察性的要求。

第三层：场景落地的惊喜

如果说运行时层和协作层是"基础设施的基础设施"，那么场景层才是能让普通用户感知到差异的地方。这里有几个项目值得重点说。

VisionClaw 是这批项目里最硬核的场景探索。它把整个 AI Agent 管线搭在了 Meta Ray-Ban 智能眼镜上：眼镜摄像头以 1fps 向 Gemini Live API 发送 JPEG 帧，麦克风 PCM 16kHz 音频实时传输，AI 以原生音频 24kHz 回应（不是先转文字再说话）。工具调用通过单一的 execute 工具委派给 OpenClaw 的 56+ 个技能执行。整条链路：看见→理解→行动，全部闭环。音频工程做得很细——当麦克风和扬声器在同一设备上时自动切换到激进的 AEC 回声消除模式，后台锁屏时用 VTDecompressionSession 绕过 GPU 渲染限制继续送帧。这个项目是在把"可穿戴 AI 助手"从 Demo 级推向实用级。

EdgeClaw 解决了另一个一直被低估的问题：AI Agent 的隐私泄露。它的方案是在 OpenClaw 的 Hook 系统上做一个三级安全分类（S1 安全/S2 敏感/S3 私密）的插件——S1 数据直接上云，S2 数据本地 LLM 脱敏后走隐私代理转发（原始 PII 替换为 [REDACTED:TYPE] 标记），S3 数据完全在本地的 Guard Agent 处理，云端只收到 "🔒 [Private content]" 占位符。双轨内存系统（full 和 clean 两套 MEMORY.md）确保本地模型有完整上下文，而云端模型永远看不到敏感内容。零代码侵入，全靠 Hook 注入。清华 THUNLP + 人民大学 AI 学院 + OpenBMB 联合出品，用形式化定理描述了安全保证（"对所有 S3 级数据 x，其原始内容对云端完全不可见"）——学术背景在这里很明显。

AutoResearchClaw 是这批项目中最"荒诞"也最值得认真对待的一个：全自动学术研究管线，输入一个研究课题，输出一份可投 NeurIPS/ICML/ICLR 的完整论文草稿。23 个阶段状态机，4 层引用验证（防止 LLM 幻觉引用），真实沙箱执行实验代码，自演化学习机制（30 天半衰期的经验衰减）。6.2 万行代码（含测试），1634 个通过的测试。我不认为它能生成真正创新的研究，但它在"快速原型验证"这个使用场景上的工程完成度让人印象深刻——不是那种看起来很厉害实际上输出一堆废话的工具，而是真的在真实沙箱里跑代码、真的在验证引用真实性。

NemoClaw 是 NVIDIA 官方出品，Apache 2.0 协议，用于把 OpenClaw Agent 运行在 OpenShell 安全沙箱里。Landlock + seccomp + 网络命名空间三层内核级隔离，网络策略精细到 HTTP 方法+路径级别并绑定具体二进制文件（GitHub 策略只允许 git 和 gh 命令发起请求）。最有趣的设计是推理透明代理：沙箱内的 Agent 向 https://inference.local/v1 发请求，OpenShell 网关负责注入真实 API Key 并路由到 NVIDIA Nemotron 模型或 Ollama。Agent 完全感知不到推理基础设施的变化。这是 NVIDIA 在自己的模型生态和企业安全部署上下的一步棋。

第四层：让 Agent 自我进化

这是整个生态里概念最激进的部分，也是我认为最值得关注的研究方向。

MetaClaw 做的事情是：让你的 Agent 在你正常使用的过程中，自动从对话中提取经验，生成新技能，并用这些技能改进自己的下一次推理。

它的架构是 MAML（模型无关元学习）的一个工程化实现：内循环是技能进化（每次对话后立即生效），外循环是 RL 权重更新（用 Tinker/MinT 做 LoRA 微调，通过 GRPO 风格的优势计算）。两个循环解耦，技能生成秒级响应，权重更新只在用户空闲时执行（检测键盘空闲、睡眠时段、Google Calendar 会议间隙——也就是论文中说的"MadMax 模式"）。

它的数据收集方式也很聪明：作为透明代理插在用户 Agent 和 LLM API 之间，所有对话自动成为训练数据。PRM（过程奖励模型）用三次并行 LLM 查询多数投票给每条回复打分。

支持 7 种个人 Agent（OpenClaw、CoPaw、IronClaw、PicoClaw、ZeroClaw、NanoClaw、NemoClaw）的自动接入，对每种 Agent 有独立的配置适配器。

这个框架的理念是："对话即训练"。不需要人工标注，不需要 GPU 集群，Agent 在被使用的过程中持续学习。这和当前主流的"离线微调"范式是反向的——主流范式是先收集数据、再训练、再部署；MetaClaw 的范式是部署即收集、收集即训练、训练即部署。

值不值得在生产上用？目前版本还是 v0.3.x，稳定性和效果都有待验证。但这个方向很重要：AI Agent 在实际使用中会产生大量行为数据，这些数据如果能被有效利用，将是个人化 Agent 的核心差异化资产。

我的判断

读完这 16 个项目，我有几个核心判断：

一、这个生态的基础设施意图非常清晰。 acpx（Agent Client Protocol CLI）提供了统一的 Agent 间通信协议，ClawPanel 和 AlphaClaw 提供了运维管理层，MetaClaw 提供了演化层，ClawTeam 和 HiClaw 提供了协作层。这不是一堆功能项目的随机组合，而是有意识地在构建 Agent OS 的各个系统调用层。

二、工程质量良莠不齐，但有几个项目确实值得深入研究。 MimiClaw 的嵌入式工程非常扎实，QuantClaw 的 C++ 实现有相当高的工程成熟度，Prismer 的学术场景产品完成度很高，EdgeClaw 的安全架构设计有学术严谨性。相比之下，一些项目仍处于概念验证阶段，测试覆盖不足是通病。

三、最值得关注的技术点不是单个项目的功能，而是几个横切关注点： Hook 驱动的零侵入插件系统（EdgeClaw、AutoResearchClaw 都用了这个模式）、双轨内存/会话隔离（EdgeClaw 的 full/clean 双轨）、自演化学习闭环（MetaClaw 的 support/query 分离）、凭证与 Agent 解耦（HiClaw 的网关凭证模型、NemoClaw 的推理透明代理）。这些技术点在未来的 Agent 系统设计中会反复出现。

四、这个生态目前的最大风险不是技术，而是分散。 16 个项目，来自不同团队（HKUDS、清华 THUNLP、网易有道、NVIDIA、个人开发者），协议兼容程度、维护活跃度参差不齐。ACP 协议能不能真正成为连接这些项目的胶水，是这个生态能否规模化的关键。

如果你在做 AI Agent 相关的工程或研究，我建议你重点关注：EdgeClaw 的隐私保护架构（这个问题在企业落地时会越来越重要）、MetaClaw 的在线学习范式（"对话即训练"这个方向的潜力被严重低估）、以及 MimiClaw 的嵌入式 Agent 设计（IoT + AI Agent 的结合点刚刚开始，它是目前最完整的参考实现）。

这个生态还远未成熟，但它正在认真地问一个很重要的问题：如果 AI Agent 要真正变成基础设施，它需要什么样的操作系统？

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-03-21，如有侵权请联系 cloudcommunity@tencent.com 删除

安全