
2023-2026,我们和 AI 交互的方式经历了三次根本性转变
2023 年,我们学会了一件事:写一个好的提示词。
2025 年,我们发现:提示词只是冰山一角,上下文才是关键。
2026 年,行业共识是:真正的竞争力不在模型,不在提示词,而在那个包裹模型运行的"机械外壳"——Harness。
这篇文章梳理这三层是如何一层层垒起来的,以及每一层解决了什么问题、又暴露了什么新问题。
让 LLM 给出更好的回答。在你只有 ChatGPT 一个文本框的时候,你能做的唯一一件事就是写好提示词。
角色设定:"你是一个有10年经验的后端架构师..."
分步引导:"第一步先分析,第二步再给出方案..."
少样本示例:"比如像这样回答..."Prompt Engineering 的时代,生产力完全绑定在模型的即兴表演上。
把对单次 prompt 的关注,扩展到对模型所见全部信息环境的治理。
模型每次推理时看到的内容,远不止你写的那段话:
你看到的 prompt:
"帮我审查这段代码"
模型实际看到的 context:
├── 系统提示词(System Prompt)
├── 对话历史(多轮消息)
├── 检索到的文档(RAG 注入)
├── 工具调用的返回结果
├── 项目文件内容
└── 你的 prompt: "帮我审查这段代码"技术 | 做什么 |
|---|---|
RAG(检索增强生成) | 从知识库中动态注入相关文档 |
System Prompt 设计 | 全局约束和角色定义 |
上下文压缩 | 超长对话中保留关键信息、丢弃噪音 |
多 Agent 上下文共享 | 多个 Agent 之间传递结构化信息 |
Context Engineering 的时代,我们把重心从"写 prompt"转移到了"治理信息环境"。
模型能回答好问题了,上下文也能治理好了——但怎么让模型成为一个能自主完成任务的系统?
Harness 回答了这个问题。
Harness 的原意是"马具"——套在马身上的缰绳、嚼子和鞍具。马提供动力,但马具控制方向、速度和安全。
在 AI 语境中:
模型是马,Harness 是缰绳。模型提供智能,Harness 提供控制。
┌──────────────────────────────────────────┐
│ Harness │
│ │
│ ┌─────────────┐ ┌───────────────────┐ │
│ │ Context │ │ Orchestration │ │
│ │ (信息环境) │ │ (任务规划与分解) │ │
│ ├─────────────┤ ├───────────────────┤ │
│ │ Reasoning │ │ Policy & Guard │ │
│ │ (LLM+工具) │ │ (权限和护栏) │ │
│ ├─────────────┤ ├───────────────────┤ │
│ │ State │ │ Verification │ │
│ │ (持久状态) │ │ (完成前验证) │ │
│ ├─────────────┤ └───────────────────┘ │
│ │ Observability (追踪/评估/审计) │
│ └─────────────┘ │
└──────────────────────────────────────────┘构件 | 做什么 | 为什么需要 |
|---|---|---|
Context | 管理和注入模型所需的信息 | 继承第二层的成果 |
Orchestration | 把复杂任务拆成子任务、编排执行顺序 | 模型不自带规划能力 |
Reasoning Core | LLM 推理 + 工具调用 | Agent 循环的心脏 |
Policy & Guard | 明确什么能做、什么不能做 | 防止模型越权、乱花钱 |
State | 跨会话持久化状态 | 一次对话装不下整个任务 |
Verification | 完成前必须验证 | 对抗"改完就宣布搞定" |
Observability | 全链路追踪、成本统计、评估 | 看不见就等于不存在 |
时代 | 年份 | 解决的问题 | 核心手段 | 遗留问题 |
|---|---|---|---|---|
Prompt | 2023 | 让模型输出更好 | 角色设定、分步引导、少样本 | 完全依赖模型,不可编程 |
Context | 2024-25 | 治理信息环境 | RAG、压缩、多 Agent 共享 | 不能自主行动,状态不持久 |
Harness | 2026 | 构建自主系统 | 编排、护栏、持久化、验证 | 复杂度陡增,调试成本高 |
2026 年已经有新方向在冒头:
2023 年我们学会了写提示词,2024 年我们学会了管上下文,2026 年我们终于理解:真正的工程不在 prompt 里,而在那个让模型安全、可靠、可控地运行的"缰绳"里。
本文基于 2023-2026 年 AI 工程实践发展脉络编写。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。