为什么 Agent Skill 不是通过向量 RAG 召回的？

CandyTong

发布于 2026-06-05 20:07:51

一个真实的困境

假设你让 AI 帮你新增一个用户管理页面，用表格展示数据，写完后 review 一下代码再 commit。

这背后有一个关键问题：AI 怎么知道该调用哪些 skill？它面前可能有几十个 skill——新增页面、表格开发、code review、commit、国际化、权限配置……它必须从里面挑出需要的那几个，还要按正确的顺序组合起来。

那 skill 是怎么实现的呢？之前我之前文章已经详细说过，是给 skill 列表给大模型，让大模型自行选择。但为什么是给 skill 让大模型自己选，而不是大模型通过查找的方式召回 skill 呢？比如用 RAG 做向量检索，或者用关键词匹配，本质都是一回事——让外部系统替模型决定该用什么。

如果通过查找召回 Skill

如果用查找来解决这个问题，以 RAG 为例，首先得在本地搭一套基础设施：一个向量数据库，一个 embedding 模型。每个 skill 的名称、描述、使用场景都要做向量化存进去。skill 新增或更新了，向量库要同步更新。

搭完之后，每次模型需要用到某个能力时，流程是这样的：

模型从头到尾都不知道有哪些 skill 可用。它只能描述"我现在需要什么能力"，然后等查找系统返回候选集。模型甚至不知道自己漏掉了什么——如果某一步没有命中正确的 skill，链路就断在这里了。

这套方案有两个根本问题。

查找阶段没有模型参与

不管是向量检索还是关键词匹配，查找的本质都是数学计算——它能回答"这两段文本像不像"，但不能回答"完成 A 之后应该做什么"。

"新增页面 → 表格开发 → 代码审查 → 提交"是一条有先后顺序的开发链路。查找衡量不了这种时序关系——就像搜索引擎能帮你找到相关文档，但不能帮你规划先读哪篇、再读哪篇。

模型在整个查找过程中是被动的：它只能在返回的结果里挑选，无法主动思考"我还有哪些 skill 可以用"。

模型看不到全局

每一步查找都只返回一个候选集，模型只能在这个"小窗口"里做决策。它不知道全局有哪些 skill 可用，也无法提前规划多步工作流。

如果某一步的查询没有命中正确的 skill，整个链路就断了。用户说"写完 review 再 commit"，但查找系统认为"review"和 code review skill 的描述不够相似，模型就会漏掉这一步——它甚至不知道自己漏掉了什么。

更麻烦的是组合场景。假设你有四个 skill：新增页面、表格开发、code review、commit。用户说"帮我新增一个用户管理页面，用表格展示，写完 review 再 commit"。查找方案下，模型可能在第一步匹配到"新增页面"，执行完后不知道还有"表格开发"——因为它从未看到过完整的 skill 列表，每一步都只能看到查找系统给的局部结果。

让模型自己选 Skill

另一种思路更直接：把所有可用 skill 的列表一次性交给模型，让模型自己决定调用哪些。

关键区别在于：模型在对话开始时就知道有哪些 skill 可用，不需要每一步都去问别人。

这种方案下，模型能做的远不止"找到匹配的 skill"：

1. 提前规划：看到用户说"新增页面，用表格展示，review 再 commit"，模型一开始就知道四个 skill 都在列表里，直接规划出完整链路
2. 组合编排：模型能自行决定先调哪个、再调哪个，比如先建页面骨架，再填充表格组件，最后审查和提交
3. 灵活应变：如果开发过程中发现页面需要路由配置，模型知道列表里有哪些相关 skill，可以中途插入调用

查找 vs Skill 列表：核心区别

两种方案的本质差异不在于"用了什么技术"，而在于决策权在谁手里。

	查找召回（RAG 等）	Skill 列表
决策链	用户输入 → 查找系统检索 → 候选集 → 模型在候选集中选择	用户输入 → 模型直接面对全量 skill 列表 → 模型自主选择
模型角色	被动，只能在检索结果里挑	主动，自己思考该调用什么
全局视野	看不到，每步只有局部候选集	看得到，一开始就知道所有可用 skill
组合编排	依赖每步检索命中，可能断链	模型自行规划完整链路
基础设施	需要额外的查找系统（向量库、索引等）	无额外依赖
扩展上限	理论上无上限	受上下文窗口限制，skill 描述会被截断