首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >长上下文大模型能读十万字,为啥 Skill 偏爱 Markdown,而RAG 还要拆成小片段?

长上下文大模型能读十万字,为啥 Skill 偏爱 Markdown,而RAG 还要拆成小片段?

作者头像
瑭宋元
发布2026-06-19 08:17:15
发布2026-06-19 08:17:15
240
举报

导语

很多做 AI 智能体(Agent)的朋友,都会遇到两个百思不得其解的问题:

第一,用来给 AI 设定能力的 Skill 文件,行业里清一色都是 Markdown 格式。Word、JSON 也能存规则,为什么偏偏 MD 成了行业标准?

第二,现在的大模型都能读几万、几十万字的长文本了,做 RAG 问答时,却依然要把文档切成 256、512 字的小片段。

但同样是给模型看的内容,Skill 文件却可以完整直接投喂,不用拆分。

大部分人都把Skill 和 RAG混为一谈,觉得都是“给大模型补资料”。

其实二者完全不是一回事:RAG 负责给 AI 补知识,Skill 负责教 AI 做事情

下面我会尽量用通俗易懂的方式来解释下,看完后能彻底分清两者的底层逻辑。

一、为什么 AI 技能 Skill,默认只用 Markdown?

先搞懂:Skill 文件是什么?

简单说,就是AI 智能体的专属操作手册

里面写清楚了:AI 能做什么、什么场景能触发、一步步怎么操作、出错了怎么办、输出格式是什么。

而 Markdown 能成为行业唯一标配,核心是它完美适配了 AI 开发和团队协作的所有需求,是 JSON、Word、纯文本比不了的。

1. 人能轻松看懂,AI 也天生适配

Markdown 格式非常简单,就是标题、列表、表格、代码块,没有复杂的符号。

对普通人:不用懂代码,产品、运营、业务人员都能直接编写、修改 AI 的操作规则。

对大模型:网上海量的技术文档、开源手册都是 Markdown 格式,模型早就学熟了,能精准区分「规则、步骤、示例、要求」,不会看混内容。

反观 JSON 这类格式,满屏括号、引号,不仅人看着费劲,还会占用更多文本字数,无形中增加使用成本。

2. 支持版本记录,改规则全程可追溯

企业的 AI 技能不是一成不变的,会经常更新流程、修改规则、新增功能。

Markdown 是纯文本文件,能直接用 Git 管理,每一次修改、谁改的、改了什么、什么时候改的,全部有记录,不满意还能一键回退。

如果用数据库、Word 存技能规则,每次修改都要重新部署、手动存档,不仅麻烦,还容易丢失记录,出了问题根本找不到原因。

3. 一个文件,装下所有 AI 技能内容

一份标准的 Skill 手册,内容很杂:功能介绍、操作步骤、参数说明、代码示例、对话案例。

Markdown 可以完美兼容所有内容:标题分层梳理流程、表格整理参数、代码块存放脚本、段落写清规则。

不用拆分多个文件,一个文档就能搞定 AI 的整套能力配置,维护起来极其省心。

4. 不用全读完,智能按需加载

这是 Skill 最核心的优势,也是和 RAG 最大的区别。

AI 读取 Markdown 技能手册时,不用一次性读完几万字全文。

它会先看开头,判断当前用户需求用不用得上这个技能,用得上再读取对应的操作步骤,用不上直接跳过,不浪费资源。

5. 通用无绑定,所有 AI 框架都能用

Markdown 版的 Skill 是行业通用标准,主流的 AI 框架、智能体工具都能直接识别使用。

一份技能手册,可以跨项目、跨团队复用,不会被某个平台绑定。

而自定义的配置文件,只能适配单一平台,换个环境就用不了,迁移成本极高。

补充:Skill 文件到底要不要切片拆分?

不用拆分(90% 场景):直接给 AI 用的技能手册,是一套完整的操作流程,一旦拆分,步骤就断了,AI 就不会正常干活了,直接完整投喂即可。

需要拆分(极少场景):如果你的技能有成百上千份,需要搜索匹配对应的技能,就按标题简单分层拆分,不用粗暴截断。

二、彻底分清:RAG 补知识,Skill 教做事

一句话讲透核心区别:

RAG 解决:AI 不知道某个知识、某个资料

Skill 解决:AI 知道知识,但不知道怎么一步步完成任务

1. RAG 是什么?

RAG (检索增强生成)在应用上本质就是知识库问答。

比如公司的合同、规章制度、产品手册,大模型原本没有这些信息,就把这些文档入库。用户提问时,AI 从库里找出相关片段,结合内容回答问题。

特点:只是调取现成知识,被动回答问题,不会主动执行多步骤任务。

2. Skill 是什么?

Skill 是 AI 的工作流程手册。

比如“自动整理报表、推送消息、审核数据”,Skill 会告诉 AI 第一步做什么、第二步做什么、遇到问题怎么处理、调用什么工具。

特点:主动指挥 AI 干活,约束 AI 的行为,让输出结果稳定、标准化。

3. 核心区别对照表(一目了然)

对比维度

RAG 知识库

Skill 技能手册(Markdown)

核心作用

提供事实知识、补充资料

定义操作流程、规范 AI 行为

文本处理方式

必须切成 256-1024 字小片段

完整读取,不拆分流程

内容特点

知识点零散,互不关联

步骤强关联,拆分就失效

结果稳定性

容易匹配到无关内容,答案不稳定

流程固定,输出结果统一标准

适用场景

查政策、查合同、查资料问答

自动办公、数据处理、多步骤任务

三、灵魂疑问:长文本大模型,为啥 RAG 还要切小片段?

很多人疑惑:大模型都能读十万字了,为什么 RAG 文档非要切成 256 字的碎片?

记住关键结论:切片不是受制于大模型,而是受制于检索模型

RAG 工作分两步:先把文档变成向量存入知识库,再检索匹配。

而负责转换向量的模型,容量很小,最多只能处理几百字。

如果不切片,直接上传长文档,会出现 3 个致命问题:

  1. 匹配不准:长文档内容杂乱,混杂很多无关知识,检索时会匹配到大量无效内容;
  2. 浪费资源:每次都加载整篇文档,大量无关内容占用模型资源,不仅慢还费钱;
  3. 答案出错:冗余信息太多,模型注意力被分散,容易产生幻觉、答非所问。

而 Skill 不需要走检索匹配流程,直接当做指令发给大模型,所以不用切片,完整读取即可。

四、实战落地:Skill 和 RAG 怎么配合干活?

两者互不冲突、互为补充,一套完整的 AI 工作流程是这样的:

用户需求:根据本月销售合同,生成业绩报告并推送到企业群

  1. AI 先读取 Skill 技能手册,明确整套执行流程:先查数据、再统计分析、再生成报告、最后推送;
  2. 按照 Skill 要求,调用 RAG 知识库,检索本月销售合同、业绩数据;
  3. RAG 把切片后的精准数据返回给 AI;
  4. AI 按照 Skill 固定流程,整理数据、生成标准报告、完成推送。

简单总结分工:RAG 负责找素材,Skill 负责教 AI 怎么用素材干活。

五、落地避坑 4 条核心经验

  1. 操作流程别放 RAG:多步骤的工作流程、业务规范,一定要做成 Skill,切片后流程会断裂失效;
  2. 海量知识别做 Skill:合同、政策、海量资料,更新频繁,适合入库走 RAG 检索;
  3. Skill 尽量完整使用:日常调用不用拆分,仅大规模技能库匹配时,按需分层切片;
  4. 长文本模型不替代 RAG 切片:不管大模型上下文多长,RAG 切片都是必须的,这是检索模型的硬性规则。
  5. 特定文档不要用固定长度切片:代码、标书、规范等不能简单扔进RAG固定长度切片,先根据文档格式,定义适合的语义切片规则,然后再进行切片,否则RAG的问答召回率和精准率都会非常差。

从普通对话 AI,到智能体 Agent,行业迭代的核心就是分工明确:

知识查询交给 RAG,任务执行交给 Skill

看懂 Markdown 成为 Skill 标准的底层逻辑,分清两者的定位和差异,才能避开 AI 落地的常见误区,搭建出稳定、好维护、能落地的企业 AI 智能体体系。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-06-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Agent 政企应用研习社 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、为什么 AI 技能 Skill,默认只用 Markdown?
  • 二、彻底分清:RAG 补知识,Skill 教做事
  • 三、灵魂疑问:长文本大模型,为啥 RAG 还要切小片段?
  • 四、实战落地:Skill 和 RAG 怎么配合干活?
  • 五、落地避坑 4 条核心经验
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档