
🚩 2026 年「术哥无界」系列实战文档 X 篇原创计划 第 125 篇,Hermes Agent 最佳实战「2026」系列第 6 篇
大家好,欢迎来到 术哥无界 | ShugeX | 运维有术。
我是术哥,一名专注于 AI 编程、AI 智能体、Agent Skills、MCP、云原生、AIOps、Milvus 向量数据库的技术实践者与开源布道者!
Talk is cheap, let's explore。无界探索,有术而行。

如果你在用 Hermes Agent,可能已经注意到最近 GitHub 上动静不小。5 月 28 日,Nous Research 发布了 v0.15.0,代号 The Velocity Release。一天之后,v0.15.1 hotfix 跟上。
这个版本自 v0.14.0 以来积累了 1,302 次提交、747 个合并 PR、560+ 个 Issue 关闭、321 位社区贡献者。数字摆在这儿,量级确实不小。
但数量不是重点。重点是:这次更新改了架构、加了多 Agent 协作、砍掉了搜索环节的 LLM 依赖,还顺带把安全防御给补上了。
Hermes Agent 是 Nous Research 做的开源自进化 AI 代理,MIT 许可证。核心卖点是内置的自改进学习循环 - Agent 会在使用过程中自动创建 Skills,持续优化自己的行为。GitHub 上目前 173k Star、29.1k Fork,3 个月爬到这个量级,在 AI Agent 领域算是明星项目了。
说明:本文内容基于 Hermes Agent 官方 Release Notes(RELEASE_v0.15.0.md、RELEASE_v0.15.1.md)和项目源码分析整理而成。文中的性能数据和功能描述均来自官方发布文档,实际效果请以你的环境和版本测试结果为准。如果有实际使用经验,欢迎在评论区分享交流。
下面逐个拆解 v0.15 的重点更新。
run_agent.py 这个文件,之前有 16,083 行。v0.15 里被拆分成了 14 个 agent/* 模块,总行数降到 3,821 行。
缩减幅度 76%。
这种量级的重构,说实话,光看数字就有点头皮发麻。不过官方明确说了:行为不变,所有外部调用兼容。也就是说,你之前写的调用代码、脚本、集成方案,升级后应该能直接跑。

图 1:run_agent.py 从单文件拆分为 14 个模块,缩减 76%
重构的具体拆分方向,官方 Release Notes 里列得很清楚。14 个模块按职责划分:配置管理、会话处理、工具调度、记忆系统、Agent 生命周期等。
从技术角度看,这次重构做了几件关键的事:
模块边界明确。之前所有逻辑混在一个文件里,配置读取、会话管理、工具调用、记忆检索互相纠缠。拆分后每个模块有清晰的职责边界,改一个地方不用担心牵一发动全身。
可测试性提升。16,000 行的单体文件几乎不可能做单元测试。拆成独立模块后,每个模块可以单独写测试用例,CI 流程也更可靠。
社区贡献门槛降低。这是容易被忽略但很重要的一个点。新人想给项目提 PR,面对 16,000 行的文件基本无从下手。拆分后,定位问题和修改代码的难度大幅下降。
感兴趣的建议直接翻 GitHub 上的 RELEASE_v0.15.0.md,里面有完整的模块清单和每个模块的职责说明。
这次更新里 PR 数量最多的功能是 Kanban 多 Agent 平台,涉及 104 个 PR。
核心命令就一个:
hermes kanban swarm跑起来之后,它会自动创建一个 Swarm v1 图,包含以下角色:

图 2:Swarm v1 五角色拓扑,一条命令创建完整的多 Agent 协作体系
几个关键设计决策值得说说:
任务自动拆分。Root 接到一个任务后,会自动拆分成子任务分发给 Workers。每个子任务可以指定不同的模型。比如,代码生成用 Claude,文本总结用 GPT-4o,图像处理用专用模型。
Worktree 隔离。每个 Worker 在独立的 Git worktree 里工作,互不干扰。这个设计在多人协作场景下特别实用,不会出现改着改着把别人的代码覆盖了的问题。而且 worktree 的好处是共享 .git 目录,不占额外太多磁盘空间。
定时启动。支持 cron 表达式设定任务的启动时间,配合 Hermes 内置的调度器用。比如设定每天凌晨 2 点跑一轮代码审查,或者每周一生成项目状态报告。
从架构层面看,Swarm v1 的设计有几个值得注意的地方。Blackboard 作为共享状态存储,解决了多 Agent 之间的信息同步问题。Verifier 角色的引入,说明设计者对 Agent 输出的可靠性有清醒的认识 - 不是 AI 生成的结果就一定靠谱,需要交叉验证。Synthesizer 负责汇总,避免多个 Worker 的输出碎片化。
如果你在做 CI/CD 集成或者批量处理任务,这个 Swarm 模式值得深入研究。
v0.15.1 修了两个问题:Worker 收到 SIGTERM 信号后无法正常终止的 bug,以及 Worker 无法接收图片的限制。如果你打算用 Swarm 做涉及图像的任务,记得升到 v0.15.1。
这次代号叫 The Velocity Release,速度确实是重头戏。
先看几个关键指标:
指标 | 旧版 | v0.15 | 变化 |
|---|---|---|---|
冷启动时间 | 701ms | 258ms | -63% |
每轮函数调用数 | 399k | 213k | -47% |
Termux 冷启动 | 2.9s | 0.8s | -72% |

图 3:冷启动降 63%、函数调用减 47%、Termux 冷启动降 72%
冷启动从 701ms 降到 258ms 这个数据,来自官方基准测试。对比了一下,这个速度已经超过了 Codex CLI 的冷启动时间。
不过话说回来,冷启动速度对日常使用的影响取决于你的使用模式。如果你是开一个 Agent 跑一整天,冷启动差 400ms 无所谓。但如果你频繁创建和销毁 Agent 实例 - 比如在 CI/CD pipeline 里 - 这个差距累积下来就很可观了。
函数调用减少 47% 的原因,跟 v0.15 引入的 Progressive Tool Loading 有关。简单说就是:不再一次性加载所有工具的 Schema,而是初始只加载约 20 个核心工具,其余的通过 tool_search(query) 和 tool_details(name) 按需加载。
# tool_search 配置项
tool_search:
mode: auto # auto | always | nevermode 三个选项的含义:auto 按需加载(默认),always 全部预加载(和旧行为一致),never 禁用按需加载。如果你发现某些工具调用异常,可以临时切到 always 排查。
这个机制对 Context Window 的节省效果很明显。特别是用 OpenRouter 接 200+ 模型的场景,初始工具 Schema 从 34 个降到约 20 个,省出来的 token 空间可以让模型处理更多实际内容。
Termux 冷启动从 2.9s 降到 0.8s 也很亮眼。在手机上跑 Agent 的场景虽然小众,但确实有人在用。这个优化让移动端的可用性提升了一大截。
这个改动我觉得是 v0.15 里性价比很高的一个。
旧版的 session_search 需要调用一个辅助 LLM 来理解搜索意图。这意味着每次搜索都要消耗 API 额度,单次大约 $0.30。而且速度慢,一次 discovery 大约需要 90 秒。
v0.15 彻底干掉了辅助 LLM,改用本地化的搜索方案:
操作 | 旧版 | v0.15 |
|---|---|---|
Discovery | ~90s, $0.30/call | ~20ms, $0 |
Scroll | ~90s, $0.30/call | ~1ms, $0 |
4500 倍加速,完全免费。
说实话,对于一个搜索功能来说,旧版每次花 $0.30、等 90 秒,确实有点奢侈。新版用本地索引替代 LLM 推理,既快又省钱,这种改动很实在。
如果你之前因为搜索太慢或太贵而很少用 session_search,升级后值得重新试试。
AI Agent 的安全问题一直是个隐忧,但真正在产品层面做防护的不多。v0.15 这次的安全更新,灵感来自 Brainworm/Promptware Kill Chain 研究(论文编号 arxiv 2601.09625)。
简单解释一下 Promptware 攻击的原理:攻击者把恶意指令藏在看似正常的内容里(比如一个 Markdown 文件、一段代码注释、一个 API 响应),Agent 在处理这些内容时,会把恶意指令当作正常 prompt 来执行。这就好比有人往你的外卖里掺了东西,你吃的时候完全察觉不到。
v0.15 加了三层防御:
工具输出边界标记。所有工具返回的内容会被加上边界标记,防止恶意指令通过工具输出注入到 Agent 的上下文里。这解决的是工具返回的内容里藏了一段恶意 prompt 的问题。从实现角度看,类似于在 HTML 里做输入转义,把不可信内容隔离在一个安全的范围内。
Memory 和 Skills 扫描。Agent 的记忆文件和技能文件会被自动扫描,检测危险模式。如果你用的某个 Skill 包含了可疑的 prompt 注入代码,系统会告警。这个功能在社区生态越来越大的背景下特别重要。第三方 Skill 数量在快速增长,质量参差不齐,有自动扫描机制比靠人工审查靠谱得多。
控制面板文件写保护。auth.json、config.yaml 等关键配置文件被设为写保护,Agent 自身无法修改这些文件。这防止了 Agent 被诱导后修改自己的认证信息。比如攻击者通过 Promptware 让 Agent 把 API Key 发送到外部服务器,或者修改模型端点指向攻击者控制的服务器。写保护机制直接从文件层面切断了这条攻击路径。
这三层加在一起,基本覆盖了 Promptware 攻击的主要路径。对于把 Agent 跑在生产环境的团队来说,这个功能升级的价值不小。

图 4:Promptware 三层防御 — 边界标记、内容扫描、文件写保护
之前的 API Key 管理方式是每个 Provider 单独配一个。你有 OpenRouter 的 key、NovitaAI 的 key、NVIDIA NIM 的 key... 配起来有点繁琐。
v0.15 集成了 Bitwarden Secrets Manager,一个 BWS_ACCESS_TOKEN 就能替代所有 per-provider API key。
# 设置环境变量
export BWS_ACCESS_TOKEN=your_token_here支持 EU Cloud 和自托管的 Bitwarden 服务器。如果你的组织已经在用 Bitwarden 管理密钥,这个集成基本可以做到零额外成本接入。
v0.15 的更新列表很长,除了上面几个大头,还有一些值得一提的:
ntfy 通知平台。Hermes 现在支持 23 个消息平台,新增的 ntfy 是一个轻量级的开源推送服务,自建成本低。之前已经有 Telegram、Discord、Slack、WhatsApp、Signal 这些主流平台,ntfy 的加入主要是面向那些不想依赖第三方服务的用户。
Skill Bundles。之前加载多个 Skill 需要一条条执行,现在可以一个命令打包加载。对于有固定 Skill 组合的场景,比如代码审查 + 测试生成 + 文档编写这种常见组合,省了不少操作。
TUI 多会话编排器。终端界面支持同时管理多个会话,切换更方便。如果你同时在跑多个 Agent 任务,不用再开多个终端窗口了。
Krea 2 图像生成 + FAL 插件化。图像生成能力升级到 Krea 2,FAL 作为插件化接入,扩展性更好。FAL 的插件化设计意味着后续添加新的图像生成服务会更方便。
MCP 目录 + 交互式安装器。MCP(Model Context Protocol)工具有了目录浏览和交互式安装功能,找工具、装工具的体验改善了不少。之前找 MCP 工具基本靠 Google 搜索 + 手动配置,现在有了目录就方便多了。
xAI 深度集成。包括 Web Search、OAuth proxy、模型退休检测。用 xAI 模型的用户应该能感受到更流畅的体验。模型退休检测这个功能挺实用 - xAI 偶尔会下线旧版模型,自动检测并提示切换可以避免调用报错。
Docker s6-overlay 容器监管。Docker 部署场景下,容器进程管理更稳定。s6-overlay 是一个轻量级的 init 系统,专门用于容器内的进程管理。加了这层之后,Agent 进程崩溃可以自动重启,不会导致整个容器退出。
v0.15.0 发布一天后,v0.15.1 就来了。修了几个实际问题:
--insecure 参数。之前 Docker 模式下的一些安全检查过于严格,v0.15.1 加了 --insecure 显式选项,让用户自己决定是否跳过。如果你已经在跑 v0.15.0,建议直接升到 v0.15.1。
升级命令很简单:
# pip 安装的用户
pip install --upgrade hermes-agent
# 确认版本
hermes --version
# 应该输出 v0.15.1 或更高Docker 用户:
docker pull nousresearch/hermes-agent:latest从源码安装的:
cd hermes-agent
git pull origin main
git checkout v0.15.1
pip install -e .几个升级注意事项:
auth.json 和 config.yamlauto 模式,如果遇到工具调用问题,先切到 always 模式排查Hermes Agent 目前的生态数据挺能说明问题的。GitHub 上 173k Star、29.1k Fork,3 个月达到这个量级,增长确实快。项目语言构成是 Python 89.1% + TypeScript 8.1%,技术栈比较统一。
周边工具也形成了不错的生态:
项目 | Star | 用途 |
|---|---|---|
AionUi | 27.2k | 桌面应用,支持 Hermes + Claude Code + Codex 等 20+ CLI |
agentmemory | 19.6k | 跨 Agent 持久记忆引擎,原生支持 Hermes |
agency-agents-zh | 13.3k | 215 个 AI 专家角色,含中国本土化角色 |
hermes-web-ui | 6.6k | Web 仪表板,会话管理和使用分析 |
橙皮书 | 3.9k | 花叔写的从入门到精通系列 |
AionUi 把 Hermes Agent 和 Claude Code、Codex、OpenClaw 并列为四大 CLI Agent。agentmemory 把 Hermes 列为原生支持的一等公民,提供 6-hook 深度集成。
中文社区也很活跃。花叔写的橙皮书已经覆盖了 17 章 5 个部分,从概念到核心机制到实操到场景到深度思考,内容相当全面。agency-agents-zh 里的 215 个角色中,有 46 个是中国市场原创的,包括小红书、抖音、微信、飞书、钉钉等平台的专属角色。
这些第三方项目的态度,比官方宣传更有说服力。一个项目被多少生态工具主动集成,是衡量其行业地位的好指标。
v0.15 是 Hermes Agent 项目的一个重要版本。代码量砍了 76% 却保持了行为兼容,冷启动快了 63%,搜索功能从花钱变免费,还加上了多 Agent 协作和安全防御。
如果让我挑三个升级理由:Progressive Tool Loading 省下的 token 费用、session_search 的 4500 倍加速、Promptware 安全防护。前两个直接关系到使用成本,第三个关系到安全性,都是硬需求。
Kanban Swarm 的多 Agent 协作虽然还是 v1,但设计思路清晰,后续迭代空间大。对于有复杂工作流需求的用户,这个方向值得关注。
如果你已经在用 Hermes Agent,这个版本值得升级。如果你还没用过,173k Star 和完善的生态说明它已经不是一个实验项目了。
相关资源
GitHub 仓库:https://github.com/NousResearch/hermes-agent
v0.15.0 Release Notes:https://github.com/NousResearch/hermes-agent/blob/main/RELEASE_v0.15.0.md
v0.15.1 Release Notes:https://github.com/NousResearch/hermes-agent/blob/main/RELEASE_v0.15.1.md
好啦,谢谢你观看我的文章,如果喜欢可以点赞转发给需要的朋友,我们下一期再见!敬请期待!
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。