首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >为什么我开始研究 Agent Platform Engineering

为什么我开始研究 Agent Platform Engineering

作者头像
baiyutang
发布2026-06-23 16:58:51
发布2026-06-23 16:58:51
830
举报

从一次企业 AI 平台实践,看 Agent 工程化演进

2024年末,DeepSeek-V3 开源模型横空出世,像一颗炸弹一样,让全国各企业事业单位都争相私有化部署自己的 LLM。也是从那时起,更多人开始觉得,AI普及的拐点或许真的到了。我突然感觉到,或许程序员在 AI 时代还有出路可走。

从模型部署,到企业 AI 能力中心

最初面对的问题很现实:如何让企业内部快速拥有一个安全、可控、可使用的大模型能力。

模型能跑起来,距离真正的业务使用还有很远的距离。企业级AI不是简单接入一个模型接口,它需要解决:

  • 模型如何管理
  • 检索增强(RAG)如何接入
  • 应用如何构建
  • 能力如何复用
  • 如何提供统一入口

当时手上的算力是3台 8×32G V100 显卡机器。最初也想过部署满血版模型,但为了尽快拥有可用的模型算力,我们优先在一台机器上部署了70B的DeepSeek。2025年2月,在搜集了大量资料和技术趋势之后,我们把探索方向定在了建设企业内部AI能力中心

为什么选择 Dify

我们选择了Dify作为基础平台,原因很直接:它最适合探索阶段的验证需求。

对于刚开始建设企业AI能力的团队,最大的挑战不是技术实现,而是不确定性。我们需要验证:

  • 大模型是否真的能解决业务问题?
  • 如何能快速落地?
  • 业务团队如何参与?
  • AI应用应该如何构建?

Dify提供了低门槛的完整链路:模型接入、知识库、Workflow编排、应用管理、API调用——让技术团队可以快速完成从0到1的验证。

具体来说:

我们花了两周时间,用Dify搭建了第一个内部知识库问答应用,把公司的培训资料接入,验证了RAG能否回答员工问题。这次快速验证很关键——它让我们从"AI听起来不错"跳到"AI能力确实可以自建"。这个小胜利给了整个项目继续投入的信心。

为什么没有直接用 Agent 开发框架?

探索过程中我也关注过 Eino / LangChain / LangGraph 这类 Agent 开发框架。从技术角度看,框架提供更强的灵活性和控制力。

但企业AI落地早期,不可控因素太多。直接基于框架建设,意味着要同时承担:

  • 较高的时间成本
  • 较高的学习成本
  • 较高的维护成本

而现实是,团队没有这么多资源可以投入。在验证阶段,最关键的是快速验证业务价值,所以选择平台化工具,是更现实的工程路径。

从 AI 应用,到平台能力沉淀

第一个工作流在Dify上调试成功后,我们很快面临下一个问题:如何让各个业务线接入AI。

API显然是最简单的方式——定义好输入参数,就能按照预编排的流程串联出处理逻辑。但更现实的问题随之而来:不同的接入方、不同的业务方,要怎么做隔离、应用隔离、权限控制?

我们当时的方案大致是这样:

  • 测试环境:所有人可以在同一个平台里验证业务实现和自动化逻辑,全员开放。
  • 低代码界面:让所有人能以可视化的方式理解AI应用——怎么组装节点、插件、接口,串联出某个场景的能力。
  • 生产环境:仅少数人可以操作,保证能力的稳定性,对外只以接口形式交付。
  • 通用能力封装:工作流、知识库检索、LLM接口统一封装,保证对外接口的稳定性。
  • 权限路由:内部维护Dify的API接入权限校验,业务方只需在Header中传递应用名,即可路由到对应的工作流。

做到这一步,我们越来越感觉到,这套自己封装、提升易用性的平台,其实带着一些"中台"的影子——但又不完全是传统意义上的中台。

这也推动我重新思考AI应用与 Platform Engineering之间的关系。

软件工程的演进规律

过去几年,软件工程一直在解决一个问题:如何把复杂的系统变得更容易构建、更容易运行

工程体系不断把复杂度沉淀到平台层:

代码语言:javascript
复制
单体应用
  ↓
微服务
  ↓
云原生
  ↓
Platform Engineering

走到这一步,我逐渐意识到:AI Agent平台的建设,本质上仍然延续着现代软件工程体系的核心架构—— Infra / Platform / Governance / Observability / Gateway。变化的是,这套架构正在针对Agent这一新范式的特定需求、新问题和更高目标,进行一次深度的重构、增强和特化。

Agent 进入工程化阶段

Agent不是2025年才出现的概念,早期已有探索——如何让大模型不仅生成内容,还能完成任务。真正的变化是:Agent正从实验形态走向工程化应用

一个简单AI应用是:

代码语言:javascript
复制
用户 → 模型 → 回答

而真实的Agent系统,是多轮决策和执行的循环:

代码语言:javascript
复制
用户目标 → 任务理解 → 规划 → 工具调用 → 执行 → 反馈 → 调整

Agent的本质变化在于:它不再只是一次请求-响应,而是成为软件系统中的一种新的执行单元

真正的工程,就像数据库或Kubernetes一样,是把复杂性隐藏起来:

  • 应用开发者不需要关心如何扩展Agent(平台处理)
  • 不需要关心如何监控和告警(平台处理)
  • 不需要关心如何滚动更新(平台处理)

开发者只需要专注:我的Agent逻辑是什么,它需要什么工具。

Agent Platform

这是为什么我认为,企业AI平台会逐渐向Agent Platform演进。

从企业落地Dify开始,其实就已经预示着这条平台化的路径。我们最早解决的是如何让企业使用AI能力,而接下来要逐步解决的是:角色权限控制、租户隔离、工作负载的快速扩缩容、故障隔离,以及如何让大量智能体可靠、持续地运行。

它需要关注:

  • Agent Runtime
  • Workflow Orchestration
  • Context Management
  • Tool Management
  • Observability
  • Evaluation
  • Governance

工程问题,才是真问题

回顾这段过程,Agent Platform Engineering并不是突然出现的方向,而是软件工程在AI时代的自然演进。过去,平台帮助开发者更高效地构建和运行软件;未来,平台需要帮助团队构建、运行和治理大量AI Agent。

回头看开篇那句话——程序员在AI时代的出路,或许就在这里:过去大家担心的是被AI替代,但当企业真的要把AI用起来时,会发现这中间有太多工程问题需要人来解决。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-06-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Agent Platform Engineering 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 从一次企业 AI 平台实践,看 Agent 工程化演进
  • 从模型部署,到企业 AI 能力中心
  • 为什么选择 Dify
  • 为什么没有直接用 Agent 开发框架?
  • 从 AI 应用,到平台能力沉淀
  • 软件工程的演进规律
  • Agent 进入工程化阶段
  • Agent Platform
  • 工程问题,才是真问题
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档