;第三阶段:能动手执行(OpenClaw及类似工具)——AI开始拥有操作数字世界的“手”,能“动”起来了;最终阶段:完整的Agent——拥有大脑、感官和手脚的AI,可以像人一样替你完成复杂的跨应用任务, 打个比方:OpenClaw就像你的手。你大脑决定要写字,手就负责握笔、移动。它的名字“Open”意味着它是开放的、可定制的,“Claw”(爪子)则形象地表示了它抓取和操作物体的能力。 三、OpenClaw与AI工具(DeepSeek/Kimi/豆包)的关系简单地讲,AI工具(DeepSeek/Kimi/豆包等等)都只是停留在思考的层面,而不能真正替我们去干某件事,比如这样的任务:替我们把一张表格处理完然后再根据内容写一篇工作汇报 四、OpenClaw与Agent的关系Agent(智能体)是去年爆火的AI词汇,各家的AI基本上都出了自己的智能体,其实这些智能体算不上真正意义上Agent,因为一个完整的Agent通常包含三个核心模块 五、一张图概括最后,用一张图来形象地说明这三者之间的关系。大家好,我是小生,从程序员转行做自媒体,每天学习一点AI技术。
社区规模约为Hermes的4.6倍,提交频率和版本迭代速度极快,采用"日期即版本号"的快速迭代策略。 OpenClaw的原生App(macOS/iOS/Android)和VoiceWake是显著差异化点,Hermes完全依赖消息平台。 "主动学习型"——Agent自己决定学什么、如何学。 OpenClaw的记忆系统是"结构化存储型"——提供SDK和接口让外部系统接入。这代表了两种不同的AIAgent哲学:Hermes追求Agent的自主性,OpenClaw追求可控性和集成性。 研究支持;OpenClaw是一个"全渠道消息网关+AI助手",核心差异化在于20+渠道覆盖和原生移动App生态。
今天我们想基于 OpenClaw 出发,结合 OpenAI 和 Anthropic 两篇原文的核心观点,把 Harness 的真实面貌拆开给你看。 为什么 Harness 这个概念突然变重要了 要理解 OpenClaw 和 Harness 的关系,还需要理解另一个背景:模型本身已经足够强,但大家的痛点正在转移。 Harness 至少在管四类事情 从那组对比往下拆,你会发现单 Agent 和完整 Harness 之间,至少差了四类东西。 第一类:给模型看什么。 单 Agent 只有一句 Prompt。 做的不是“再多给点说明”,而是把应用的可观察性和可验证性直接接进 Agent 的工作回路。 结语 回到最开头的问题:OpenClaw 和 Harness 是什么关系? 现在可以给一个更清晰的答案了。 OpenClaw 是一个 Gateway-First 的 Agent 运行时框架,而 Harness 是它面向大模型的那一层方法论。
OpenClaw多Agent配置实战指南简介:本文详解OpenClaw多Agent架构的完整配置流程。 如果你想为OpenClaw配置多个"员工",让不同Agent承担不同角色、拥有独立性格、工作目录和工具权限,那么多Agent架构是你的必由之路。 展开代码语言:TXTAI代码解释openclawagentsaddcreative--workspace~/.openclaw/workspace-creative创建工作区域后,这个Agent只会在这个文件夹里执行操作 绑定到不同的频道和不同的Agent进行对话,这里的bindings和文件中的Agent是同级的!这里演示discord,需要开启开发者模式,才能获取频道的id! 进阶操作,给每个智能体配置沙箱和工具,注意deny的优先级要比allow的高!
在这个ControlUI里,你会看到下面这些内容:Chat:直接在浏览器里和AI助手聊天Overview:查看Agent当前状态的总体信息Channels:连接消息应用,比如WhatsApp、Telegram 、Slack、Discord、iMessageInstances:管理正在运行的实例Sessions:查看会话和聊天历史Usage:查看使用统计CronJobs:设置自动化定时任务在控制面板顶部,你还可以切换频道和模型 6.连接消息平台https://docs.ollama.com/integrations/openclaw#connect-messaging-apps现在你可以把消息应用接进来,这样和你的Agent沟通会更方便 OpenClaw最重要的能力之一,就是你可以通过熟悉的消息应用和AIAgent对话。比如你在Telegram里发一条消息,它就会返回AI的回复。 7.配合ClaudeCode和Codex使用(额外部分)Ollama还允许你启动其他AI开发工具。
HermesAgent和OpenClaw的定位高度重叠——都是自托管的个人AI助手,都支持Telegram/Discord等多平台接入,都有Skill系统和cron调度。 三、安装方式:一条Agent接力链决定用和部署OpenClaw一样的方式来安装Hermes——全程不手动敲命令,让agent来做。 SOUL.md:把“灵魂”迁移过来Hermes支持通过~/.hermes/SOUL.md自定义agent人格,和OpenClaw的设计一模一样。 我直接把OpenClaw的SOUL.md内容迁移过来,保持一致的语言偏好和行为准则——包括始终用中文回复、不说废话、有自己的观点等。 触发机制根据文档和源码,自我进化的触发条件是:主agent完成一个调用了5+个工具的复杂任务用户纠正了agent的做法agent走过弯路但找到了正确路径发现了一个非显然的工作流config中有一个nudge
实际上,我只是从管理 Claude 代码,转而管理一个 OpenClaw 代理,这个代理又管理着一大批其他的 Claude 代码和 Codex 代理。 OpenClaw 改变了这种局面。 OpenClaw 和 Codex 的上下文截然不同: 通过上下文而非不同的模型实现专业化。 完整的八步工作流程 让我举一个上周的实际例子。 tmux 会话: # Create worktree + spawn agent git worktree add .. /run-agent.sh templates gpt-5.3-codex high" 该代理程序在 tmux 会话中运行,并通过脚本进行完整的终端日志记录。
Session(会话)是OpenClaw中管理对话上下文的核心单元。每个Session包含对话历史、用户信息、会话状态和记忆数据。 Agent(智能体)是OpenClaw的"大脑",负责理解用户意图、规划执行步骤、调用工具、生成响应。 Skill(技能)是OpenClaw的能力扩展单元,封装了特定领域的知识和工具。 @latestinstall<skill-name>#查看已安装技能openclawskillslist五、三者关系5.1协作流程5.2数据流向数据流向用户消息Session→Agent工具调用Agent "memory":{"enabled":true,"longTerm":{"file":"MEMORY.md"},"daily":{"dir":"memory"}}}}七、常见问题Q1:Session和Agent
现在媒体报道里,「桌面Agent」「ComputerUseAgent」「个人AI助手」「PC端智能体」混着用,把很多人搞乱了。我当时也纳闷,认真梳理了一下,其实有清晰的层级关系。 表面上看MCP和CUA是两条独立的技术线;拉长时间轴来看,这些都是在为「真正能干活的Agent」铺路。没有这些基础设施,OpenClaw就是一座没有供水管道的楼。 这是正确的,但也注定不容易出现OpenClaw。龙虾安装和第148个微信群OpenClaw配置复杂,APIKey申请、环境配置、权限设置,一关一关得过。 CUA理论上让普通员工用自然语言描述业务流程,Agent自动执行,门槛大幅降低。对这类企业,OpenClaw现在就可以谨慎试用。「谨慎」两个字不是客套,是真心话。大企业和涉及敏感数据的场景? 现在来看,OpenClaw改名的时候,或许已经想好了前路:用一个足够强烈的品牌完成引爆,然后借助与OpenAI的关系完成传承。但这只龙虾点燃的火,已经不属于它自己了。
它的闭环学习系统让Agent能从实践中自动提炼经验,创建可复用技能。这是一个0到1的差异——其他框架都没有这个能力。 OpenClaw最强项:IDE体验在代码理解、代码生成、项目上下文感知方面,OpenClaw仍然是无可争议的王者。它对VSCode等IDE的深度集成让编程体验流畅无比。 CrewAI最强项:多Agent协作如果你的需求是让多个AIAgent分工合作(如一个负责调研、一个负责写作、一个负责审核),CrewAI的多Agent编排能力是最成熟的。 只需注意端口冲突和系统资源占用。Q2:哪个框架的学习曲线最低?A:HermesAgent和OpenClaw都提供一行命令安装,入门门槛最低。AutoGPT和CrewAI需要更多的手动配置。 如果是全栈开发者或技术管理者,HermesAgent的全面能力和自进化特性更值得深入;如果是专注编程的开发者,OpenClaw的IDE生态值得深耕。
为了更直观地理解,我把Pi Agent和其他主流Agent的特点整理成了一个对比表格: 对比维度 OpenClaw的Pi Agent 其他主流AI Agent (如 Claude Code, Cline 通过扩展和技能来动态增加能力,甚至可以让Agent自己编写扩展。 工具丰富多样:通常自带大量预定义工具,如网页搜索、数据库查询、API调用等。许多Agent支持MCP协议来统一接入外部工具。 在OpenClaw的架构,如果说Tools(工具)是AI的“手和眼”(如浏览器、摄像头),那么Plugins(插件)和Skills(技能)就分别代表了它的“耳朵/嘴巴"和”职业专长”。 节点的作用是提供硬件能力和本地执行环境,使得OpenClaw能够超越云端API的限制,与用户的物理世界和本地数字环境进行交互。 记忆更新:整个交互过程,包括用户的指令、Agent的思考步骤和最终结果,都会被记录到记忆系统中,供未来的任务参考。
HermesAgent与OpenClaw的核心差异,源于它们根本不同的设计哲学和目标愿景。简单来说:OpenClaw是一个强大的“执行引擎”或“自动化网关”。 这种根本差异体现在多个关键维度上:1.核心能力:执行vs.学习OpenClaw:核心:专注于可靠、高效地执行预定义的任务。方式:通过一个庞大的、由社区和用户贡献的“技能”(Skills)库来实现功能。 2.架构设计:中心化网关vs.智能体引擎OpenClaw:采用中心化的“网关”(Gateway)架构。所有消息、请求都先经过这个中央控制平面进行路由、认证和分发。 事实上,Hermes提供了工具可以一键迁移OpenClaw的配置和现有技能,从而继承其强大的生态基础,并在此之上叠加自学习能力。 因此,二者的关系更像是奠基者与进化者,共同推动着复杂任务自动化向更高层次的智能迈进。
与 --agent-dir 不同,这里更侧重于“知识”和“记忆”的存储 • --agent-dir <dir>:指定当前 Agent 存放状态文件、记忆数据或内部配置的本地文件夹路径。 每个 Agent 通常需要一个独立的目录来保存其运行状态 • --model:如果需要使用自定义模型,可以添加此参数并填写模型 ID,否则将使用默认模型添加完后可以使用openclaw agents list 文件,以防修改错配置,openclaw崩kind名词解释: 值含义适用场景企业微信对应关系 direct单聊 (Direct Message)用户直接私聊机器人。 dm私信 (Direct Message)同 direct,某些框架区分 direct (系统级) 和 dm (用户级)。等同于单聊。如果 direct 报错,尝试用 dm。 /openclaw.json > /tmp/openclaw.json && mv /tmp/openclaw.json /root/.openclaw/openclaw.json
1.2 核心定位与价值主张OpenClaw 的核心定位非常清晰: 在你自己的设备上运行的 AI Agent,连接各种消息平台,提供 24/7 全天候的 AI 助手体验。 对于企业用户和注重隐私的个人用户来说,这是一个难以接受的风险。OpenClaw 完全本地运行,数据不出你的设备,从根本上解决了隐私问题。第二,多平台碎片化问题。 图1:OpenClaw 三层架构设计,展示了消息渠道层、Gateway 核心层、AI 模型层的关系消息渠道层负责统一接入各种消息平台。 ,适合调试和问题排查。 /bin/bash openclaw agent --message "审查本次代码提交:$(git diff HEAD~1)"' > .git/hooks/post-commit chmod +x .
本文旨在深入剖析 Hermes Agent 实现“自我改进”(Self-Improving)的核心原理,并系统阐述它与 OpenClaw 在架构哲学和实际能力上的根本区别。 它的目标是让 Agent 成为一个能够从工作中自主学习、积累和复用经验的智能体。 二、 Hermes Agent 实现“自进化”的核心原理 三、 与 OpenClaw 的核心原理 四、 Hermes 与 OpenClaw 的对比 对比维度 Hermes Agent OpenClaw 能力来源于在为用户工作过程中自动积累的经验和技能。 手写配置。能力完全依赖于开发者预先编写和安装的 Skill 文件。 Hermes 是活的,能成长;OpenClaw 是静态的,需维护。 技能可被 Agent 自动创建、在使用中自动修补和完善(Pitfalls)。 静态配置文件。技能需手动编写或从社区安装,Agent 不会修改或优化它们。
这就是OpenClaw真正要解决的问题。 Agent记忆和RAG,压根不是一回事 先简单说说OpenClaw是什么。 很多人把Agent记忆和RAG混为一谈,觉得它们都是“让AI知道更多东西”。其实两者解决的是完全不同的问题。 OpenClaw是怎么把“记忆”做透的 说完区别,再来看看OpenClaw具体怎么实现的。 它的记忆系统分成两层。 第一层是日常日志,按日期存储,你们每天聊什么,它就记到什么文件里。 传统的做法是直接删掉早期的对话记录,但OpenClaw不干这种“败家”的事。 它在压缩之前,会先让Agent把重要的内容刷写到记忆文件里,然后再执行压缩。 这就相当于——你要清理房间是吧? 这就是为什么我说——2026年之后,不带记忆的AI Agent,都会显得有点残疾。 各位觉着呢?
从 OpenClaw 爆火至今已经过去一月有余,我们看到有非常多的 AI 探险家们在不断探索各种 OpenClaw 的场景和玩法。 当然,你也可以把这部分原理和方案复制给你的 OpenClaw,尝试直接对话让它协助完成配置。 步骤四:配置新增 Agent使用 openclaw agents add 命令添加新的 Agent,你需要把 workspace 路径 和 新 Agent 的名称(ID) 替换为自己想要设置的内容: agents list 步骤五:配置飞书群组绑定接下来,配置飞书群组与新 Agent 的绑定关系。 Q:独立 Agent 是否继承主 Agent 的配置? A:独立 Agent 不继承主 Agent 的配置,它们拥有完全独立的 workspace、记忆和状态。
点此即可享»轻量应用服务器专属优惠«,快速部署Hermes Agent,支持接入微信、企业微信、飞书、钉钉等主流聊天平台。 1、新手必看:Hermes Agent一键部署教程标题链接玩转Hermes Agent|使用Lighthouse快速部署云上Hermes Agent(初次上手Lighthouse部署读这篇)https: /docs/overview2、实操必看:Hermes Agent接入聊天软件标题链接云上 Hermes Agent 快速接入微信指南Lighthouse:https://cloud.tencent.com developer/article/2660601LightVela:https://lightvela.tencent.com/docs/configuration/channel-qq云上 Hermes Agent 社区资源:· Hermes Agent官方文档:点这里· Hermes Agent官方技能市场:点这里
核心概念:在 OpenClaw 中,插件不仅是功能的扩展,更是智能体 (Agent) 的手脚。 配置多 Agent 架构下的工具隔离策略。 一、什么是 Agent Tools?在 OpenClaw 架构中,Agent Tool 是一个遵循特定规范的函数定义。 高级配置项除了基础的 allow/deny,OpenClaw 还支持更细粒度的控制:配置项位置作用tools.profile全局 / Agent定义一个基础白名单模板,可被复用。 参数验证利用 Typebox 或 JSON Schema 的 required 和 format 字段进行强校验。 总结OpenClaw 的插件工具系统设计哲学是 “灵活扩展,安全可控”。作为开发者:善用 optional: true 保护用户,提供精准的 Schema 和描述。
Agent 工具是 OpenClaw 插件向大语言模型(LLM)暴露的可调用函数。 这些工具通过 JSON Schema 定义输入参数,并在代理(agent)运行时按需执行,从而扩展 AI 的能力边界——例如调用本地服务、查询数据库、触发工作流等。 execute:异步执行函数,返回符合 OpenClaw 内容格式的对象。 ⚠️ 命名冲突:若插件工具名与内置(core)工具重名,该插件工具将被自动跳过。 如需同时使用 core 和插件工具,必须显式包含 group:core 或具体 core 工具名。 七、总结 通过插件注册 Agent 工具,开发者可以安全、灵活地将外部能力注入 AI 代理流程。