Hermes Agent v0.15：76% 代码瘦身、4500× 搜索加速、63% 冷启动提升，三组数据看懂这次升级

原创

运维有术

发布于 2026-06-01 22:31:16

1920

🚩 2026 年「术哥无界」系列实战文档 X 篇原创计划第 125 篇，Hermes Agent 最佳实战「2026」系列第 6 篇
大家好，欢迎来到 术哥无界 | ShugeX ｜运维有术。
我是术哥，一名专注于 AI 编程、AI 智能体、Agent Skills、MCP、云原生、AIOps、Milvus 向量数据库的技术实践者与开源布道者！
Talk is cheap, let's explore。无界探索，有术而行。

封面图：Hermes Agent v0.15 The Velocity Release 发布封面

如果你在用 Hermes Agent，可能已经注意到最近 GitHub 上动静不小。5 月 28 日，Nous Research 发布了 v0.15.0，代号 The Velocity Release。一天之后，v0.15.1 hotfix 跟上。

这个版本自 v0.14.0 以来积累了 1,302 次提交、747 个合并 PR、560+ 个 Issue 关闭、321 位社区贡献者。数字摆在这儿，量级确实不小。

但数量不是重点。重点是：这次更新改了架构、加了多 Agent 协作、砍掉了搜索环节的 LLM 依赖，还顺带把安全防御给补上了。

Hermes Agent 是 Nous Research 做的开源自进化 AI 代理，MIT 许可证。核心卖点是内置的自改进学习循环 - Agent 会在使用过程中自动创建 Skills，持续优化自己的行为。GitHub 上目前 173k Star、29.1k Fork，3 个月爬到这个量级，在 AI Agent 领域算是明星项目了。

说明：本文内容基于 Hermes Agent 官方 Release Notes（RELEASE_v0.15.0.md、RELEASE_v0.15.1.md）和项目源码分析整理而成。文中的性能数据和功能描述均来自官方发布文档，实际效果请以你的环境和版本测试结果为准。如果有实际使用经验，欢迎在评论区分享交流。

下面逐个拆解 v0.15 的重点更新。

1. 架构重构：16000 行砍到 3800 行

run_agent.py 这个文件，之前有 16,083 行。v0.15 里被拆分成了 14 个 agent/* 模块，总行数降到 3,821 行。

缩减幅度 76%。

这种量级的重构，说实话，光看数字就有点头皮发麻。不过官方明确说了：行为不变，所有外部调用兼容。也就是说，你之前写的调用代码、脚本、集成方案，升级后应该能直接跑。

图 1：run_agent.py 从单文件拆分为 14 个模块，缩减 76%

重构的具体拆分方向，官方 Release Notes 里列得很清楚。14 个模块按职责划分：配置管理、会话处理、工具调度、记忆系统、Agent 生命周期等。

从技术角度看，这次重构做了几件关键的事：

模块边界明确。之前所有逻辑混在一个文件里，配置读取、会话管理、工具调用、记忆检索互相纠缠。拆分后每个模块有清晰的职责边界，改一个地方不用担心牵一发动全身。

可测试性提升。16,000 行的单体文件几乎不可能做单元测试。拆成独立模块后，每个模块可以单独写测试用例，CI 流程也更可靠。

社区贡献门槛降低。这是容易被忽略但很重要的一个点。新人想给项目提 PR，面对 16,000 行的文件基本无从下手。拆分后，定位问题和修改代码的难度大幅下降。

感兴趣的建议直接翻 GitHub 上的 RELEASE_v0.15.0.md，里面有完整的模块清单和每个模块的职责说明。

2. Kanban 多 Agent 协作：一键创建 Swarm

这次更新里 PR 数量最多的功能是 Kanban 多 Agent 平台，涉及 104 个 PR。

核心命令就一个：

hermes kanban swarm

跑起来之后，它会自动创建一个 Swarm v1 图，包含以下角色：

Root - 任务分配和协调
Workers - 并行执行具体任务
Verifier - 验证结果质量
Synthesizer - 汇总输出
Blackboard - 共享状态存储

图 2：Swarm v1 五角色拓扑，一条命令创建完整的多 Agent 协作体系

几个关键设计决策值得说说：

任务自动拆分。Root 接到一个任务后，会自动拆分成子任务分发给 Workers。每个子任务可以指定不同的模型。比如，代码生成用 Claude，文本总结用 GPT-4o，图像处理用专用模型。

Worktree 隔离。每个 Worker 在独立的 Git worktree 里工作，互不干扰。这个设计在多人协作场景下特别实用，不会出现改着改着把别人的代码覆盖了的问题。而且 worktree 的好处是共享 .git 目录，不占额外太多磁盘空间。

定时启动。支持 cron 表达式设定任务的启动时间，配合 Hermes 内置的调度器用。比如设定每天凌晨 2 点跑一轮代码审查，或者每周一生成项目状态报告。

从架构层面看，Swarm v1 的设计有几个值得注意的地方。Blackboard 作为共享状态存储，解决了多 Agent 之间的信息同步问题。Verifier 角色的引入，说明设计者对 Agent 输出的可靠性有清醒的认识 - 不是 AI 生成的结果就一定靠谱，需要交叉验证。Synthesizer 负责汇总，避免多个 Worker 的输出碎片化。

如果你在做 CI/CD 集成或者批量处理任务，这个 Swarm 模式值得深入研究。

v0.15.1 修了两个问题：Worker 收到 SIGTERM 信号后无法正常终止的 bug，以及 Worker 无法接收图片的限制。如果你打算用 Swarm 做涉及图像的任务，记得升到 v0.15.1。

3. 性能数据：冷启动降 63%，函数调用砍近半

这次代号叫 The Velocity Release，速度确实是重头戏。

先看几个关键指标：

指标	旧版	v0.15	变化
冷启动时间	701ms	258ms	-63%
每轮函数调用数	399k	213k	-47%
Termux 冷启动	2.9s	0.8s	-72%

图 3：冷启动降 63%、函数调用减 47%、Termux 冷启动降 72%

冷启动从 701ms 降到 258ms 这个数据，来自官方基准测试。对比了一下，这个速度已经超过了 Codex CLI 的冷启动时间。

不过话说回来，冷启动速度对日常使用的影响取决于你的使用模式。如果你是开一个 Agent 跑一整天，冷启动差 400ms 无所谓。但如果你频繁创建和销毁 Agent 实例 - 比如在 CI/CD pipeline 里 - 这个差距累积下来就很可观了。

函数调用减少 47% 的原因，跟 v0.15 引入的 Progressive Tool Loading 有关。简单说就是：不再一次性加载所有工具的 Schema，而是初始只加载约 20 个核心工具，其余的通过 tool_search(query) 和 tool_details(name) 按需加载。

# tool_search 配置项
tool_search:
  mode: auto  # auto | always | never

mode 三个选项的含义：auto 按需加载（默认），always 全部预加载（和旧行为一致），never 禁用按需加载。如果你发现某些工具调用异常，可以临时切到 always 排查。

这个机制对 Context Window 的节省效果很明显。特别是用 OpenRouter 接 200+ 模型的场景，初始工具 Schema 从 34 个降到约 20 个，省出来的 token 空间可以让模型处理更多实际内容。

Termux 冷启动从 2.9s 降到 0.8s 也很亮眼。在手机上跑 Agent 的场景虽然小众，但确实有人在用。这个优化让移动端的可用性提升了一大截。

4. session_search 重建：4500 倍加速，完全免费

这个改动我觉得是 v0.15 里性价比很高的一个。

旧版的 session_search 需要调用一个辅助 LLM 来理解搜索意图。这意味着每次搜索都要消耗 API 额度，单次大约 $0.30。而且速度慢，一次 discovery 大约需要 90 秒。

v0.15 彻底干掉了辅助 LLM，改用本地化的搜索方案：

操作	旧版	v0.15
Discovery	~90s, $0.30/call	~20ms, $0
Scroll	~90s, $0.30/call	~1ms, $0

4500 倍加速，完全免费。

说实话，对于一个搜索功能来说，旧版每次花 $0.30、等 90 秒，确实有点奢侈。新版用本地索引替代 LLM 推理，既快又省钱，这种改动很实在。

如果你之前因为搜索太慢或太贵而很少用 session_search，升级后值得重新试试。

5. 安全防御：Promptware 防护

AI Agent 的安全问题一直是个隐忧，但真正在产品层面做防护的不多。v0.15 这次的安全更新，灵感来自 Brainworm/Promptware Kill Chain 研究（论文编号 arxiv 2601.09625）。

简单解释一下 Promptware 攻击的原理：攻击者把恶意指令藏在看似正常的内容里（比如一个 Markdown 文件、一段代码注释、一个 API 响应），Agent 在处理这些内容时，会把恶意指令当作正常 prompt 来执行。这就好比有人往你的外卖里掺了东西，你吃的时候完全察觉不到。

v0.15 加了三层防御：

工具输出边界标记。所有工具返回的内容会被加上边界标记，防止恶意指令通过工具输出注入到 Agent 的上下文里。这解决的是工具返回的内容里藏了一段恶意 prompt 的问题。从实现角度看，类似于在 HTML 里做输入转义，把不可信内容隔离在一个安全的范围内。

Memory 和 Skills 扫描。Agent 的记忆文件和技能文件会被自动扫描，检测危险模式。如果你用的某个 Skill 包含了可疑的 prompt 注入代码，系统会告警。这个功能在社区生态越来越大的背景下特别重要。第三方 Skill 数量在快速增长，质量参差不齐，有自动扫描机制比靠人工审查靠谱得多。

控制面板文件写保护。auth.json、config.yaml 等关键配置文件被设为写保护，Agent 自身无法修改这些文件。这防止了 Agent 被诱导后修改自己的认证信息。比如攻击者通过 Promptware 让 Agent 把 API Key 发送到外部服务器，或者修改模型端点指向攻击者控制的服务器。写保护机制直接从文件层面切断了这条攻击路径。

这三层加在一起，基本覆盖了 Promptware 攻击的主要路径。对于把 Agent 跑在生产环境的团队来说，这个功能升级的价值不小。

图 4：Promptware 三层防御 — 边界标记、内容扫描、文件写保护

6. Bitwarden Secrets Manager 集成

之前的 API Key 管理方式是每个 Provider 单独配一个。你有 OpenRouter 的 key、NovitaAI 的 key、NVIDIA NIM 的 key... 配起来有点繁琐。

v0.15 集成了 Bitwarden Secrets Manager，一个 BWS_ACCESS_TOKEN 就能替代所有 per-provider API key。

# 设置环境变量
export BWS_ACCESS_TOKEN=your_token_here

支持 EU Cloud 和自托管的 Bitwarden 服务器。如果你的组织已经在用 Bitwarden 管理密钥，这个集成基本可以做到零额外成本接入。

7. 其他值得关注的更新

v0.15 的更新列表很长，除了上面几个大头，还有一些值得一提的：

ntfy 通知平台。Hermes 现在支持 23 个消息平台，新增的 ntfy 是一个轻量级的开源推送服务，自建成本低。之前已经有 Telegram、Discord、Slack、WhatsApp、Signal 这些主流平台，ntfy 的加入主要是面向那些不想依赖第三方服务的用户。

Skill Bundles。之前加载多个 Skill 需要一条条执行，现在可以一个命令打包加载。对于有固定 Skill 组合的场景，比如代码审查 + 测试生成 + 文档编写这种常见组合，省了不少操作。

TUI 多会话编排器。终端界面支持同时管理多个会话，切换更方便。如果你同时在跑多个 Agent 任务，不用再开多个终端窗口了。

Krea 2 图像生成 + FAL 插件化。图像生成能力升级到 Krea 2，FAL 作为插件化接入，扩展性更好。FAL 的插件化设计意味着后续添加新的图像生成服务会更方便。

MCP 目录 + 交互式安装器。MCP（Model Context Protocol）工具有了目录浏览和交互式安装功能，找工具、装工具的体验改善了不少。之前找 MCP 工具基本靠 Google 搜索 + 手动配置，现在有了目录就方便多了。

xAI 深度集成。包括 Web Search、OAuth proxy、模型退休检测。用 xAI 模型的用户应该能感受到更流畅的体验。模型退休检测这个功能挺实用 - xAI 偶尔会下线旧版模型，自动检测并提示切换可以避免调用报错。

Docker s6-overlay 容器监管。Docker 部署场景下，容器进程管理更稳定。s6-overlay 是一个轻量级的 init 系统，专门用于容器内的进程管理。加了这层之后，Agent 进程崩溃可以自动重启，不会导致整个容器退出。

8. v0.15.1 Hotfix：修了什么

v0.15.0 发布一天后，v0.15.1 就来了。修了几个实际问题：

Dashboard 401 无限重载循环。登录过期后，Dashboard 页面会无限重载，必须手动清 cookie 才能恢复。这个 bug 对 Web UI 用户影响比较大。
Docker --insecure 参数。之前 Docker 模式下的一些安全检查过于严格，v0.15.1 加了 --insecure 显式选项，让用户自己决定是否跳过。
Worker SIGTERM 终止。Kanban Swarm 里的 Worker 在收到终止信号后无法正常退出。
Worker 接收图片。之前 Workers 无法处理图片输入，修了。

如果你已经在跑 v0.15.0，建议直接升到 v0.15.1。

升级指南

升级命令很简单：

# pip 安装的用户
pip install --upgrade hermes-agent

# 确认版本
hermes --version
# 应该输出 v0.15.1 或更高

Docker 用户：

docker pull nousresearch/hermes-agent:latest

从源码安装的：

cd hermes-agent
git pull origin main
git checkout v0.15.1
pip install -e .

几个升级注意事项：

配置兼容性：官方说外部调用完全兼容，但建议升级前备份 auth.json 和 config.yaml
Progressive Tool Loading：升级后默认开启 auto 模式，如果遇到工具调用问题，先切到 always 模式排查
session_search：升级后第一次搜索会重建索引，之后就是 20ms 级别的响应了
Kanban Swarm：新功能，建议先用小任务测试，确认 Workers 行为正常再上生产

生态一览

Hermes Agent 目前的生态数据挺能说明问题的。GitHub 上 173k Star、29.1k Fork，3 个月达到这个量级，增长确实快。项目语言构成是 Python 89.1% + TypeScript 8.1%，技术栈比较统一。

周边工具也形成了不错的生态：

项目	Star	用途
AionUi	27.2k	桌面应用，支持 Hermes + Claude Code + Codex 等 20+ CLI
agentmemory	19.6k	跨 Agent 持久记忆引擎，原生支持 Hermes
agency-agents-zh	13.3k	215 个 AI 专家角色，含中国本土化角色
hermes-web-ui	6.6k	Web 仪表板，会话管理和使用分析
橙皮书	3.9k	花叔写的从入门到精通系列

AionUi 把 Hermes Agent 和 Claude Code、Codex、OpenClaw 并列为四大 CLI Agent。agentmemory 把 Hermes 列为原生支持的一等公民，提供 6-hook 深度集成。

中文社区也很活跃。花叔写的橙皮书已经覆盖了 17 章 5 个部分，从概念到核心机制到实操到场景到深度思考，内容相当全面。agency-agents-zh 里的 215 个角色中，有 46 个是中国市场原创的，包括小红书、抖音、微信、飞书、钉钉等平台的专属角色。

这些第三方项目的态度，比官方宣传更有说服力。一个项目被多少生态工具主动集成，是衡量其行业地位的好指标。

总结

v0.15 是 Hermes Agent 项目的一个重要版本。代码量砍了 76% 却保持了行为兼容，冷启动快了 63%，搜索功能从花钱变免费，还加上了多 Agent 协作和安全防御。

如果让我挑三个升级理由：Progressive Tool Loading 省下的 token 费用、session_search 的 4500 倍加速、Promptware 安全防护。前两个直接关系到使用成本，第三个关系到安全性，都是硬需求。

Kanban Swarm 的多 Agent 协作虽然还是 v1，但设计思路清晰，后续迭代空间大。对于有复杂工作流需求的用户，这个方向值得关注。

如果你已经在用 Hermes Agent，这个版本值得升级。如果你还没用过，173k Star 和完善的生态说明它已经不是一个实验项目了。

v0.15.0 Release Notes：https://github.com/NousResearch/hermes-agent/blob/main/RELEASE_v0.15.0.md

v0.15.1 Release Notes：https://github.com/NousResearch/hermes-agent/blob/main/RELEASE_v0.15.1.md

好啦，谢谢你观看我的文章，如果喜欢可以点赞转发给需要的朋友，我们下一期再见！敬请期待！

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

Hermes Agent

腾讯技术创作特训营S18

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

Hermes Agent

腾讯技术创作特训营S18

登录后参与评论

0 条评论

热度