Prompt 到 Context 到 Harness：AI 工程的三层进化

原创

卢旺

发布于 2026-06-08 18:48:28

1380

2023-2026，我们和 AI 交互的方式经历了三次根本性转变

开篇：三层，三次跃迁

2023 年，我们学会了一件事：写一个好的提示词。

2025 年，我们发现：提示词只是冰山一角，上下文才是关键。

2026 年，行业共识是：真正的竞争力不在模型，不在提示词，而在那个包裹模型运行的"机械外壳"——Harness。

这篇文章梳理这三层是如何一层层垒起来的，以及每一层解决了什么问题、又暴露了什么新问题。

第一层：Prompt Engineering（2023）

解决了什么

让 LLM 给出更好的回答。在你只有 ChatGPT 一个文本框的时候，你能做的唯一一件事就是写好提示词。

核心手段

角色设定："你是一个有10年经验的后端架构师..."
分步引导："第一步先分析，第二步再给出方案..."
少样本示例："比如像这样回答..."

暴露了什么

模型是全部，人只能适应模型 —— 同一个 prompt 在 GPT-3.5 和 GPT-4 上的结果天差地别
每次对话独立 —— 没有记忆，没有积累，每次都是从头开始
不可编程 —— 你能控制的只是一个文本框里的文字，没法调用工具、没法访问数据库

Prompt Engineering 的时代，生产力完全绑定在模型的即兴表演上。

第二层：Context Engineering（2024-2025）

解决了什么

把对单次 prompt 的关注，扩展到对模型所见全部信息环境的治理。

核心洞察

模型每次推理时看到的内容，远不止你写的那段话：

你看到的 prompt:
  "帮我审查这段代码"

模型实际看到的 context:
  ├── 系统提示词（System Prompt）
  ├── 对话历史（多轮消息）
  ├── 检索到的文档（RAG 注入）
  ├── 工具调用的返回结果
  ├── 项目文件内容
  └── 你的 prompt: "帮我审查这段代码"

核心手段

技术	做什么
RAG（检索增强生成）	从知识库中动态注入相关文档
System Prompt 设计	全局约束和角色定义
上下文压缩	超长对话中保留关键信息、丢弃噪音
多 Agent 上下文共享	多个 Agent 之间传递结构化信息

暴露了什么

信息环境污染 —— 上下文越长，模型越容易被无关内容干扰
上下文窗口有限 —— 再多也装不下一个完整项目
无法自主行动 —— 模型仍然只是"回答问题"，不能"执行任务"
状态不持久 —— 每次对话结束后上下文就消失了

Context Engineering 的时代，我们把重心从"写 prompt"转移到了"治理信息环境"。

第三层：Harness Engineering（2026）

解决了什么

模型能回答好问题了，上下文也能治理好了——但怎么让模型成为一个能自主完成任务的系统？

Harness 回答了这个问题。

什么是 Harness

Harness 的原意是"马具"——套在马身上的缰绳、嚼子和鞍具。马提供动力，但马具控制方向、速度和安全。

在 AI 语境中：

模型是马，Harness 是缰绳。模型提供智能，Harness 提供控制。

Harness 的七个构件

┌──────────────────────────────────────────┐
│               Harness                     │
│                                           │
│  ┌─────────────┐  ┌───────────────────┐  │
│  │ Context     │  │ Orchestration     │  │
│  │ (信息环境)   │  │ (任务规划与分解)    │  │
│  ├─────────────┤  ├───────────────────┤  │
│  │ Reasoning   │  │ Policy & Guard    │  │
│  │ (LLM+工具)   │  │ (权限和护栏)       │  │
│  ├─────────────┤  ├───────────────────┤  │
│  │ State       │  │ Verification      │  │
│  │ (持久状态)   │  │ (完成前验证)       │  │
│  ├─────────────┤  └───────────────────┘  │
│  │ Observability (追踪/评估/审计)         │
│  └─────────────┘                         │
└──────────────────────────────────────────┘

每一层解释

构件	做什么	为什么需要
Context	管理和注入模型所需的信息	继承第二层的成果
Orchestration	把复杂任务拆成子任务、编排执行顺序	模型不自带规划能力
Reasoning Core	LLM 推理 + 工具调用	Agent 循环的心脏
Policy & Guard	明确什么能做、什么不能做	防止模型越权、乱花钱
State	跨会话持久化状态	一次对话装不下整个任务
Verification	完成前必须验证	对抗"改完就宣布搞定"
Observability	全链路追踪、成本统计、评估	看不见就等于不存在

业界的实际验证

Anthropic 的 Claude Code —— 本身就是一个 Harness，管理循环、工具调用、状态持久化、人工介入
OpenAI Codex 团队 —— 用 Harness Engineering 的理念，工程师不写代码，只设计 Harness，产出 100 万行生产级代码
LangChain —— 把编码 Agent 的基准分从 52.8% 提升到 66.5%，完全靠改进 Harness，模型没换
Mitchell Hashimoto（Terraform 创始人） —— "Agent 每次犯错，你不需要告诉它下次注意，你只需要让这类错误在系统结构上变得不可能。"

演进总结

时代	年份	解决的问题	核心手段	遗留问题
Prompt	2023	让模型输出更好	角色设定、分步引导、少样本	完全依赖模型，不可编程
Context	2024-25	治理信息环境	RAG、压缩、多 Agent 共享	不能自主行动，状态不持久
Harness	2026	构建自主系统	编排、护栏、持久化、验证	复杂度陡增，调试成本高

下一层？Meta Context & Intent Engineering

2026 年已经有新方向在冒头：

Meta Context Engineering（ICML 2026） —— 把"怎么设计上下文"这件事本身变成 AI 可学习的技能，让 AI 自己进化自己的 context 策略
Intent Engineering —— 从定义"怎么做"走向定义"要什么"，让 Agent 理解组织的目标、价值观和约束
Specification Engineering —— 把企业策略写成机器可读的规范，让 Harness 能自动理解和执行

一句话总结

2023 年我们学会了写提示词，2024 年我们学会了管上下文，2026 年我们终于理解：真正的工程不在 prompt 里，而在那个让模型安全、可靠、可控地运行的"缰绳"里。

本文基于 2023-2026 年 AI 工程实践发展脉络编写。

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

AI Coding 全栈开发

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

AI Coding 全栈开发

登录后参与评论

0 条评论

热度