首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Hermes Agent v0.15:76% 代码瘦身、4500× 搜索加速、63% 冷启动提升,三组数据看懂这次升级

Hermes Agent v0.15:76% 代码瘦身、4500× 搜索加速、63% 冷启动提升,三组数据看懂这次升级

原创
作者头像
运维有术
发布2026-06-01 22:31:16
发布2026-06-01 22:31:16
1920
举报
文章被收录于专栏:运维有术运维有术

🚩 2026 年「术哥无界」系列实战文档 X 篇原创计划 第 125 篇,Hermes Agent 最佳实战「2026」系列第 6

大家好,欢迎来到 术哥无界 | ShugeX | 运维有术

我是术哥,一名专注于 AI 编程、AI 智能体、Agent Skills、MCP、云原生、AIOps、Milvus 向量数据库的技术实践者与开源布道者

Talk is cheap, let's explore。无界探索,有术而行。

封面图:Hermes Agent v0.15 The Velocity Release 发布封面
封面图:Hermes Agent v0.15 The Velocity Release 发布封面

如果你在用 Hermes Agent,可能已经注意到最近 GitHub 上动静不小。5 月 28 日,Nous Research 发布了 v0.15.0,代号 The Velocity Release。一天之后,v0.15.1 hotfix 跟上。

这个版本自 v0.14.0 以来积累了 1,302 次提交、747 个合并 PR、560+ 个 Issue 关闭、321 位社区贡献者。数字摆在这儿,量级确实不小。

但数量不是重点。重点是:这次更新改了架构、加了多 Agent 协作、砍掉了搜索环节的 LLM 依赖,还顺带把安全防御给补上了。

Hermes Agent 是 Nous Research 做的开源自进化 AI 代理,MIT 许可证。核心卖点是内置的自改进学习循环 - Agent 会在使用过程中自动创建 Skills,持续优化自己的行为。GitHub 上目前 173k Star、29.1k Fork,3 个月爬到这个量级,在 AI Agent 领域算是明星项目了。

说明:本文内容基于 Hermes Agent 官方 Release Notes(RELEASE_v0.15.0.md、RELEASE_v0.15.1.md)和项目源码分析整理而成。文中的性能数据和功能描述均来自官方发布文档,实际效果请以你的环境和版本测试结果为准。如果有实际使用经验,欢迎在评论区分享交流。

下面逐个拆解 v0.15 的重点更新。

1. 架构重构:16000 行砍到 3800 行

run_agent.py 这个文件,之前有 16,083 行。v0.15 里被拆分成了 14 个 agent/* 模块,总行数降到 3,821 行。

缩减幅度 76%。

这种量级的重构,说实话,光看数字就有点头皮发麻。不过官方明确说了:行为不变,所有外部调用兼容。也就是说,你之前写的调用代码、脚本、集成方案,升级后应该能直接跑。

架构重构图:run_agent.py 从 16,083 行拆分为 14 个模块
架构重构图:run_agent.py 从 16,083 行拆分为 14 个模块

图 1:run_agent.py 从单文件拆分为 14 个模块,缩减 76%

重构的具体拆分方向,官方 Release Notes 里列得很清楚。14 个模块按职责划分:配置管理、会话处理、工具调度、记忆系统、Agent 生命周期等。

从技术角度看,这次重构做了几件关键的事:

模块边界明确。之前所有逻辑混在一个文件里,配置读取、会话管理、工具调用、记忆检索互相纠缠。拆分后每个模块有清晰的职责边界,改一个地方不用担心牵一发动全身。

可测试性提升。16,000 行的单体文件几乎不可能做单元测试。拆成独立模块后,每个模块可以单独写测试用例,CI 流程也更可靠。

社区贡献门槛降低。这是容易被忽略但很重要的一个点。新人想给项目提 PR,面对 16,000 行的文件基本无从下手。拆分后,定位问题和修改代码的难度大幅下降。

感兴趣的建议直接翻 GitHub 上的 RELEASE_v0.15.0.md,里面有完整的模块清单和每个模块的职责说明。

2. Kanban 多 Agent 协作:一键创建 Swarm

这次更新里 PR 数量最多的功能是 Kanban 多 Agent 平台,涉及 104 个 PR

核心命令就一个:

代码语言:bash
复制
hermes kanban swarm

跑起来之后,它会自动创建一个 Swarm v1 图,包含以下角色:

  • Root - 任务分配和协调
  • Workers - 并行执行具体任务
  • Verifier - 验证结果质量
  • Synthesizer - 汇总输出
  • Blackboard - 共享状态存储
Swarm v1 多 Agent 架构图
Swarm v1 多 Agent 架构图

图 2:Swarm v1 五角色拓扑,一条命令创建完整的多 Agent 协作体系

几个关键设计决策值得说说:

任务自动拆分。Root 接到一个任务后,会自动拆分成子任务分发给 Workers。每个子任务可以指定不同的模型。比如,代码生成用 Claude,文本总结用 GPT-4o,图像处理用专用模型。

Worktree 隔离。每个 Worker 在独立的 Git worktree 里工作,互不干扰。这个设计在多人协作场景下特别实用,不会出现改着改着把别人的代码覆盖了的问题。而且 worktree 的好处是共享 .git 目录,不占额外太多磁盘空间。

定时启动。支持 cron 表达式设定任务的启动时间,配合 Hermes 内置的调度器用。比如设定每天凌晨 2 点跑一轮代码审查,或者每周一生成项目状态报告。

从架构层面看,Swarm v1 的设计有几个值得注意的地方。Blackboard 作为共享状态存储,解决了多 Agent 之间的信息同步问题。Verifier 角色的引入,说明设计者对 Agent 输出的可靠性有清醒的认识 - 不是 AI 生成的结果就一定靠谱,需要交叉验证。Synthesizer 负责汇总,避免多个 Worker 的输出碎片化。

如果你在做 CI/CD 集成或者批量处理任务,这个 Swarm 模式值得深入研究。

v0.15.1 修了两个问题:Worker 收到 SIGTERM 信号后无法正常终止的 bug,以及 Worker 无法接收图片的限制。如果你打算用 Swarm 做涉及图像的任务,记得升到 v0.15.1。

3. 性能数据:冷启动降 63%,函数调用砍近半

这次代号叫 The Velocity Release,速度确实是重头戏。

先看几个关键指标:

指标

旧版

v0.15

变化

冷启动时间

701ms

258ms

-63%

每轮函数调用数

399k

213k

-47%

Termux 冷启动

2.9s

0.8s

-72%

性能数据对比图:三项关键指标优化
性能数据对比图:三项关键指标优化

图 3:冷启动降 63%、函数调用减 47%、Termux 冷启动降 72%

冷启动从 701ms 降到 258ms 这个数据,来自官方基准测试。对比了一下,这个速度已经超过了 Codex CLI 的冷启动时间。

不过话说回来,冷启动速度对日常使用的影响取决于你的使用模式。如果你是开一个 Agent 跑一整天,冷启动差 400ms 无所谓。但如果你频繁创建和销毁 Agent 实例 - 比如在 CI/CD pipeline 里 - 这个差距累积下来就很可观了。

函数调用减少 47% 的原因,跟 v0.15 引入的 Progressive Tool Loading 有关。简单说就是:不再一次性加载所有工具的 Schema,而是初始只加载约 20 个核心工具,其余的通过 tool_search(query)tool_details(name) 按需加载。

代码语言:yaml
复制
# tool_search 配置项
tool_search:
  mode: auto  # auto | always | never

mode 三个选项的含义:auto 按需加载(默认),always 全部预加载(和旧行为一致),never 禁用按需加载。如果你发现某些工具调用异常,可以临时切到 always 排查。

这个机制对 Context Window 的节省效果很明显。特别是用 OpenRouter 接 200+ 模型的场景,初始工具 Schema 从 34 个降到约 20 个,省出来的 token 空间可以让模型处理更多实际内容。

Termux 冷启动从 2.9s 降到 0.8s 也很亮眼。在手机上跑 Agent 的场景虽然小众,但确实有人在用。这个优化让移动端的可用性提升了一大截。

4. session_search 重建:4500 倍加速,完全免费

这个改动我觉得是 v0.15 里性价比很高的一个。

旧版的 session_search 需要调用一个辅助 LLM 来理解搜索意图。这意味着每次搜索都要消耗 API 额度,单次大约 $0.30。而且速度慢,一次 discovery 大约需要 90 秒。

v0.15 彻底干掉了辅助 LLM,改用本地化的搜索方案:

操作

旧版

v0.15

Discovery

~90s, $0.30/call

~20ms, $0

Scroll

~90s, $0.30/call

~1ms, $0

4500 倍加速,完全免费。

说实话,对于一个搜索功能来说,旧版每次花 $0.30、等 90 秒,确实有点奢侈。新版用本地索引替代 LLM 推理,既快又省钱,这种改动很实在。

如果你之前因为搜索太慢或太贵而很少用 session_search,升级后值得重新试试。

5. 安全防御:Promptware 防护

AI Agent 的安全问题一直是个隐忧,但真正在产品层面做防护的不多。v0.15 这次的安全更新,灵感来自 Brainworm/Promptware Kill Chain 研究(论文编号 arxiv 2601.09625)。

简单解释一下 Promptware 攻击的原理:攻击者把恶意指令藏在看似正常的内容里(比如一个 Markdown 文件、一段代码注释、一个 API 响应),Agent 在处理这些内容时,会把恶意指令当作正常 prompt 来执行。这就好比有人往你的外卖里掺了东西,你吃的时候完全察觉不到。

v0.15 加了三层防御:

工具输出边界标记。所有工具返回的内容会被加上边界标记,防止恶意指令通过工具输出注入到 Agent 的上下文里。这解决的是工具返回的内容里藏了一段恶意 prompt 的问题。从实现角度看,类似于在 HTML 里做输入转义,把不可信内容隔离在一个安全的范围内。

Memory 和 Skills 扫描。Agent 的记忆文件和技能文件会被自动扫描,检测危险模式。如果你用的某个 Skill 包含了可疑的 prompt 注入代码,系统会告警。这个功能在社区生态越来越大的背景下特别重要。第三方 Skill 数量在快速增长,质量参差不齐,有自动扫描机制比靠人工审查靠谱得多。

控制面板文件写保护auth.jsonconfig.yaml 等关键配置文件被设为写保护,Agent 自身无法修改这些文件。这防止了 Agent 被诱导后修改自己的认证信息。比如攻击者通过 Promptware 让 Agent 把 API Key 发送到外部服务器,或者修改模型端点指向攻击者控制的服务器。写保护机制直接从文件层面切断了这条攻击路径。

这三层加在一起,基本覆盖了 Promptware 攻击的主要路径。对于把 Agent 跑在生产环境的团队来说,这个功能升级的价值不小。

Promptware 三层防御架构图
Promptware 三层防御架构图

图 4:Promptware 三层防御 — 边界标记、内容扫描、文件写保护

6. Bitwarden Secrets Manager 集成

之前的 API Key 管理方式是每个 Provider 单独配一个。你有 OpenRouter 的 key、NovitaAI 的 key、NVIDIA NIM 的 key... 配起来有点繁琐。

v0.15 集成了 Bitwarden Secrets Manager,一个 BWS_ACCESS_TOKEN 就能替代所有 per-provider API key。

代码语言:bash
复制
# 设置环境变量
export BWS_ACCESS_TOKEN=your_token_here

支持 EU Cloud 和自托管的 Bitwarden 服务器。如果你的组织已经在用 Bitwarden 管理密钥,这个集成基本可以做到零额外成本接入。

7. 其他值得关注的更新

v0.15 的更新列表很长,除了上面几个大头,还有一些值得一提的:

ntfy 通知平台。Hermes 现在支持 23 个消息平台,新增的 ntfy 是一个轻量级的开源推送服务,自建成本低。之前已经有 Telegram、Discord、Slack、WhatsApp、Signal 这些主流平台,ntfy 的加入主要是面向那些不想依赖第三方服务的用户。

Skill Bundles。之前加载多个 Skill 需要一条条执行,现在可以一个命令打包加载。对于有固定 Skill 组合的场景,比如代码审查 + 测试生成 + 文档编写这种常见组合,省了不少操作。

TUI 多会话编排器。终端界面支持同时管理多个会话,切换更方便。如果你同时在跑多个 Agent 任务,不用再开多个终端窗口了。

Krea 2 图像生成 + FAL 插件化。图像生成能力升级到 Krea 2,FAL 作为插件化接入,扩展性更好。FAL 的插件化设计意味着后续添加新的图像生成服务会更方便。

MCP 目录 + 交互式安装器。MCP(Model Context Protocol)工具有了目录浏览和交互式安装功能,找工具、装工具的体验改善了不少。之前找 MCP 工具基本靠 Google 搜索 + 手动配置,现在有了目录就方便多了。

xAI 深度集成。包括 Web Search、OAuth proxy、模型退休检测。用 xAI 模型的用户应该能感受到更流畅的体验。模型退休检测这个功能挺实用 - xAI 偶尔会下线旧版模型,自动检测并提示切换可以避免调用报错。

Docker s6-overlay 容器监管。Docker 部署场景下,容器进程管理更稳定。s6-overlay 是一个轻量级的 init 系统,专门用于容器内的进程管理。加了这层之后,Agent 进程崩溃可以自动重启,不会导致整个容器退出。

8. v0.15.1 Hotfix:修了什么

v0.15.0 发布一天后,v0.15.1 就来了。修了几个实际问题:

  • Dashboard 401 无限重载循环。登录过期后,Dashboard 页面会无限重载,必须手动清 cookie 才能恢复。这个 bug 对 Web UI 用户影响比较大。
  • Docker --insecure 参数。之前 Docker 模式下的一些安全检查过于严格,v0.15.1 加了 --insecure 显式选项,让用户自己决定是否跳过。
  • Worker SIGTERM 终止。Kanban Swarm 里的 Worker 在收到终止信号后无法正常退出。
  • Worker 接收图片。之前 Workers 无法处理图片输入,修了。

如果你已经在跑 v0.15.0,建议直接升到 v0.15.1。

升级指南

升级命令很简单:

代码语言:bash
复制
# pip 安装的用户
pip install --upgrade hermes-agent

# 确认版本
hermes --version
# 应该输出 v0.15.1 或更高

Docker 用户:

代码语言:bash
复制
docker pull nousresearch/hermes-agent:latest

从源码安装的:

代码语言:bash
复制
cd hermes-agent
git pull origin main
git checkout v0.15.1
pip install -e .

几个升级注意事项:

  1. 配置兼容性:官方说外部调用完全兼容,但建议升级前备份 auth.jsonconfig.yaml
  2. Progressive Tool Loading:升级后默认开启 auto 模式,如果遇到工具调用问题,先切到 always 模式排查
  3. session_search:升级后第一次搜索会重建索引,之后就是 20ms 级别的响应了
  4. Kanban Swarm:新功能,建议先用小任务测试,确认 Workers 行为正常再上生产

生态一览

Hermes Agent 目前的生态数据挺能说明问题的。GitHub 上 173k Star、29.1k Fork,3 个月达到这个量级,增长确实快。项目语言构成是 Python 89.1% + TypeScript 8.1%,技术栈比较统一。

周边工具也形成了不错的生态:

项目

Star

用途

AionUi

27.2k

桌面应用,支持 Hermes + Claude Code + Codex 等 20+ CLI

agentmemory

19.6k

跨 Agent 持久记忆引擎,原生支持 Hermes

agency-agents-zh

13.3k

215 个 AI 专家角色,含中国本土化角色

hermes-web-ui

6.6k

Web 仪表板,会话管理和使用分析

橙皮书

3.9k

花叔写的从入门到精通系列

AionUi 把 Hermes Agent 和 Claude Code、Codex、OpenClaw 并列为四大 CLI Agent。agentmemory 把 Hermes 列为原生支持的一等公民,提供 6-hook 深度集成。

中文社区也很活跃。花叔写的橙皮书已经覆盖了 17 章 5 个部分,从概念到核心机制到实操到场景到深度思考,内容相当全面。agency-agents-zh 里的 215 个角色中,有 46 个是中国市场原创的,包括小红书、抖音、微信、飞书、钉钉等平台的专属角色。

这些第三方项目的态度,比官方宣传更有说服力。一个项目被多少生态工具主动集成,是衡量其行业地位的好指标。

总结

v0.15 是 Hermes Agent 项目的一个重要版本。代码量砍了 76% 却保持了行为兼容,冷启动快了 63%,搜索功能从花钱变免费,还加上了多 Agent 协作和安全防御。

如果让我挑三个升级理由:Progressive Tool Loading 省下的 token 费用session_search 的 4500 倍加速Promptware 安全防护。前两个直接关系到使用成本,第三个关系到安全性,都是硬需求。

Kanban Swarm 的多 Agent 协作虽然还是 v1,但设计思路清晰,后续迭代空间大。对于有复杂工作流需求的用户,这个方向值得关注。

如果你已经在用 Hermes Agent,这个版本值得升级。如果你还没用过,173k Star 和完善的生态说明它已经不是一个实验项目了。

相关资源

GitHub 仓库:https://github.com/NousResearch/hermes-agent

v0.15.0 Release Notes:https://github.com/NousResearch/hermes-agent/blob/main/RELEASE_v0.15.0.md

v0.15.1 Release Notes:https://github.com/NousResearch/hermes-agent/blob/main/RELEASE_v0.15.1.md

好啦,谢谢你观看我的文章,如果喜欢可以点赞转发给需要的朋友,我们下一期再见!敬请期待!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 架构重构:16000 行砍到 3800 行
  • 2. Kanban 多 Agent 协作:一键创建 Swarm
  • 3. 性能数据:冷启动降 63%,函数调用砍近半
  • 4. session_search 重建:4500 倍加速,完全免费
  • 5. 安全防御:Promptware 防护
  • 6. Bitwarden Secrets Manager 集成
  • 7. 其他值得关注的更新
  • 8. v0.15.1 Hotfix:修了什么
  • 升级指南
  • 生态一览
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档