
最近这两年,在很多公司里,大模型成了一种奇妙的存在。
它不像一个技术工具,更像是一只突然闯进会议室的大象。
领导一拍桌子:
“我们也要上大模型!”
业务同事一听:
“我们这个流程能不能加个大模型?”
产品经理眼睛一亮:
“这个页面右下角是不是可以放一个智能助手?”
技术同事默默打开vibe coding,心里想:
“你们到底是想解决问题,还是想给问题贴个AI标签?”

于是,很多公司出现了一种很有意思的现象:大模型应用上线了一大堆,汇报材料里金光闪闪,PPT上智能体横飞,能力地图铺满整页,结果真正使用的人没几个。
有些需求,原本一个规则引擎就能解决80%;
有些问题,一个小模型分类器就能搞定90%;
有些流程,甚至只需要把表单字段、审批逻辑和数据口径梳理清楚。
但现在不一样了。
能上大模型,就绝不上规则。
能让大模型思考,就绝不自己先想清楚。
能起名叫“智能体”,就绝不叫“工具”。
仿佛只要把“AI”“大模型”“智能助手”“Agent”几个词往系统上一贴,业务问题就会自动变得高级。
但现实往往很残酷。
大模型不是万能药,它更像一把电锯,你拿它砍树,效率惊人,你拿它削苹果,场面就比较血腥。
这件事其实不能简单怪业务,也不能简单怪领导。
大模型这波浪潮,本质上确实太震撼了。
过去我们谈AI,更多是在谈分类、预测、推荐、识别、排序。这些能力很重要,但它们通常藏在系统后面,用户不太能直接感受到。
推荐系统再强,用户看到的是“猜你喜欢”;
风控模型再强,用户看到的是“审批通过/不通过”;
营销模型再强,客户经理看到的是“名单排序”。
这些AI能力很像幕后工作人员,干活多,但存在感不强。
大模型不一样。
它一上来就会说话、会总结、会写方案、会解释、会聊天。哪怕它有时候一本正经地胡说八道,也不妨碍大家第一次感受到:
“原来机器真的可以像人一样处理复杂任务。”
这一下,想象空间被打开了。
领导看到的是战略机会:
“这东西必须跟上。”
业务看到的是效率幻想:
“是不是以后写报告、查资料、做分析都能交给它?”
技术看到的是架构升级:
“终于有机会重构一下过去那些难用的系统了。”
供应商看到的是商机:
“老板,您这个场景特别适合做一个智能体。”
于是大家一拍即合,大模型项目就像春天的小草,一夜之间长满了组织的各个角落。
但问题也在这里。
当一个技术太火的时候,人们往往不是先问“它适合解决什么问题”,而是先问“我这里能不能用上它”。
这个顺序一反,很多项目就开始跑偏了。
最常见的情况是:AI需求看起来做了很多,但真正高频使用的不多。
一个系统里塞了十几个智能助手。
有“智能问答助手”,有“报告生成助手”,有“经营分析助手”,有“方案推荐助手”,有“策略复盘助手”,还有一个不知道干什么但名字很厉害的“全流程智能体”。
上线时热热闹闹,汇报时掌声阵阵。
过了一个月打开后台一看,访问量寥寥无几。
这时候大家开始互相困惑。
技术说:“我们能力已经接进去了。”
产品说:“入口也做了,按钮也放了。”
业务说:“我们平时确实也没太想起来用。”
这就很尴尬。
很多AI应用没人用,不是因为模型不够强,而是因为它没有嵌进真实工作流。
它像一个站在办公楼门口的热心群众,能力很强,态度很好,但大家上班时根本不会经过它。
真正有价值的AI应用,不应该是让用户“专门打开一个AI工具”,而应该是嵌在用户原本就要完成的动作里。
比如客户经理本来就要看客户信息,那客户洞察就应该出现在客户详情页里;
运营人员本来就要制定活动策略,那策略建议就应该出现在策略配置过程中;
管理者本来就要看经营报表,那异常解释和行动建议就应该跟指标波动绑定在一起。
AI不是多一个入口,而是少一步操作,不是多一个系统,而是把原来的系统变聪明一点。
很多AI项目失败,第一步就失败在这里:它做成了“展示技术能力的样板间”,而不是“解决业务问题的工具间”。
样板间很好看,但没人住。
另一类问题更典型:本来规则、小模型、检索、流程编排就能解决的事,非要上大模型。
比如:
判断客户是否满足某个条件,用规则就够了;
识别一句话属于哪类意图,用分类模型就够了;
根据字段生成固定格式说明,用模板就够了;
从知识库里查标准答案,用检索增强就够了;
对名单做排序,用传统机器学习模型可能更稳定。
但现在有些项目会直接说:
“让大模型来判断吧。”
乍一听很高级,仔细一想很浪费。
大模型当然能判断,但它不一定最适合判断。
就像你可以请一个博士生帮你数电梯里有几个人,但这件事装个摄像头或者红外传感器可能更合适。

大模型的优势在于处理非结构化、开放式、语义复杂、需要综合判断的任务。比如:
理解一段客户通话背后的真实诉求;
把零散材料整理成结构化分析;
根据业务目标生成初步策略方案;
对异常经营指标给出可能原因;
在多轮对话中不断澄清用户意图。
这些场景里,规则往往写不完,小模型覆盖不住,传统系统又太僵硬,大模型才真正有用武之地。
但如果任务本身边界清楚、规则稳定、输入结构化、输出确定,那强行上大模型,反而会带来新的问题。
大模型天然消耗昂贵的GPU和电力,成本更高;大模型的参数量巨大,运算速度更慢;大模型基于语言的概率给出答案,结果不稳定,大模型内核原理对业务就是一个黑盒,无法说明,解释更困难;出了错还不好定位,你只能靠经验去猜,去想,去不断尝试一个新的提示词。
本来是一个“if else”能搞定的问题,最后变成了“Prompt怎么写”“温度怎么调”“幻觉怎么控”“日志怎么审”“答案为什么每次不一样”。
这不是智能化升级,这是把简单问题复杂化。
很多时候,真正成熟的AI架构,不是“所有问题都交给大模型”,而是把规则、小模型、检索、大模型、流程引擎组合起来,各干各的活。
规则负责确定性。
小模型负责高频轻量判断。
检索负责知识定位。
大模型负责理解、生成、推理和编排。
人工负责最终判断、经验沉淀和风险兜底。
这才叫体系。
否则就像一个公司明明有财务、人事、行政、销售、技术,结果所有事都让CEO亲自干。
CEO再厉害,也会崩。
还有一种更隐蔽的问题:业务自己没有把问题想明白,却希望大模型直接给出答案。
这类需求经常长这样:
“我们想做一个智能经营助手,能够自动分析客户、制定策略、推荐产品、生成话术、跟踪过程、复盘效果。”
听起来很完整,但似乎经不起推敲。
如果你再问业务一句:
“那现在人工是怎么做的?”
对方说:
“每个人经验不太一样。”
继续问:
“优秀员工怎么做?”
对方说:
“这个还没系统梳理。”
再问:
“策略好坏怎么评价?”
对方说:
“这个也要探索。”
最后问:
“输出结果给谁用?在什么节点用?用了之后怎么反馈?”
会议室突然安静。
这时候你就会发现,大模型不是解决方案,而是照妖镜。
它照出来的不是模型能力不足,而是业务知识没有沉淀、流程没有标准化、评价指标不清晰、经验没有结构化。
很多人误以为大模型可以绕过这些基础工作。
不需要梳理业务流程了,大模型会自己理解;
不需要总结专家经验了,大模型会自己推理;
不需要定义评价标准了,大模型会自己判断;
不需要建设知识库了,大模型会自己知道。
这就有点像你把一个刚入职的员工叫过来,对他说:
“你去把我们公司最复杂的业务搞定,要求符合监管、提升业绩、用户满意、还能形成闭环。资料嘛,你自己悟。”
这员工不离职已经算情绪稳定。
大模型确实很强,但它需要上下文,需要知识,需要目标,需要约束,需要反馈。
它不是一个凭空降临的业务专家。它更像一个学习能力极强、表达能力极强、但需要被喂资料、被教方法、被管边界的超级实习生。
你给它高质量知识,它就能放大知识。
你给它混乱流程,它就放大混乱。
你给它优秀经验,它就复制优秀经验。
你给它一堆含糊不清的口号,它就生成更长、更漂亮、更无法落地的口号。
所以,大模型落地的核心,不是把“人的工作”一股脑扔给模型,而是先把人的经验拆出来、沉淀下来、结构化起来,再让模型去放大。
否则,模型不是智能中枢,而是高级复读机。
我越来越觉得,判断一个AI需求靠谱不靠谱,不要先看它用了什么模型,而要先问几个朴素的问题。

第一,它解决的是不是一个真实高频问题?
真实问题,不是领导觉得重要的问题,也不是PPT里显得高级的问题,而是一线每天都会遇到、反复消耗时间、影响结果质量的问题。
如果一个功能上线后,用户不用它也能完成工作,那它多半只是锦上添花。
如果用户不用它就会慢、会错、会漏、会烦,那它才有可能成为刚需。
第二,它有没有嵌入业务流程?
AI能力不能悬浮在系统外面。
它必须知道用户是谁,正在做什么,手里有什么数据,下一步要完成什么动作,输出结果要流向哪里。
一个脱离流程的AI助手,常常只能“陪聊”;
一个嵌入流程的AI助手,才可能真正“办事”。
第三,它是否选对了技术工具?
不是所有智能化都叫大模型。
能用规则解决的,优先规则;
能用小模型解决的,优先小模型;
需要查知识的,先做好知识库和检索;
需要生成、总结、推理、解释、规划的,再让大模型上场。
大模型不是第一选择,而是合适场景下的关键能力。
第四,业务知识有没有沉淀?
大模型不是来替代业务思考的,而是来放大业务思考的。
如果一个领域没有标准流程、没有专家经验、没有案例样本、没有评价指标,那直接做大模型应用,往往就是在沙地上盖楼。
看起来盖得很快,风一吹全是灰。
第五,有没有闭环评价?
AI应用不能只看“上线了没有”,而要看“用起来没有、用得好不好、有没有带来结果变化”。
比如效率有没有提升?
错误有没有减少?
客户体验有没有改善?
员工是否愿意持续使用?
模型输出是否能被业务接受?
反馈数据是否能继续优化模型?
没有评价闭环的大模型项目,就像没有体检报告的健身计划。
你每天挥汗如雨,但不知道自己到底是瘦了,还是只是更累了。
说到底,很多公司做大模型应用,最大的问题不是技术问题,而是组织问题、业务问题、方法问题。
技术永远是最后显性的一环。
真正难的是:
能不能把业务流程讲清楚;
能不能把一线痛点找准确;
能不能把专家经验沉淀下来;
能不能把模型能力放在正确位置;
能不能让AI输出进入真实生产链路;
能不能用指标证明它真的有价值。
大模型时代,最稀缺的不是“会调用模型的人”。
大模型接口只要传入正确的参数就能返回结果。
Prompt的标准写法随便一搜就能知道。
甚至未来很多Agent搭建,都会变得像搭积木一样简单。
真正稀缺的是另一类人:既懂业务,又懂技术边界,还能把复杂问题拆成可落地系统的人。
这种人不会一上来就说“我们做个智能体吧”。
他会先问:
“这个业务到底卡在哪里?”
“用户为什么不用现有系统?”
“哪些环节需要确定性,哪些环节需要生成式能力?”
“哪些知识需要沉淀,哪些判断需要人兜底?”
“模型输出之后,谁接着干下一步?”
“如果结果错了,责任链在哪里?”
这些问题听起来不性感。
但它们决定了一个AI应用到底是能活下来,还是只能活在汇报材料里。
我一直觉得,企业用大模型最健康的心态,不是“请神”,而是“招人”。
你不是把一个万能神仙请进公司,指望它点石成金;
你是在组织里加入一个新型员工,它擅长理解语言、处理知识、生成内容、辅助决策,但它也有短板,需要培训、需要流程、需要边界、需要考核。

你不能对一个新员工说:
“公司战略你自己定,业务流程你自己摸,历史资料你自己猜,出了问题你自己背。”
你也不能因为它会写几段漂亮话,就让它直接接管核心业务。
更合理的方式是:
先让它做辅助,再让它做半自动,最后在可控范围内做自动化。
先从高频、低风险、可验证的场景切入。
再逐步进入复杂、跨流程、强协同的任务。
最后形成真正的人机协同体系。
这条路看起来慢,但其实更快。
因为很多看似快速上线的大模型项目,最后都会在使用率、稳定性、效果评价和业务接受度上慢下来。
真正的快,不是第一个上线。
而是上线之后真的有人用,越用越离不开。
大模型当然重要。
它不是一阵风,也不是一个噱头。它确实会改变企业的软件形态、工作方式和组织效率。
但越是重要的技术,越不能被粗暴使用。
为了用而用的大模型,就像给自行车装飞机发动机。
听起来很猛,骑起来可能先飞出去的是人。
未来真正有价值的AI应用,不是PPT里写了多少“智能体”,也不是系统里接了多少“大模型能力”,而是它能不能悄悄改变一个真实岗位的工作方式。
让一个客服人员少翻几张表,让一个运营人员少改几版方案,让一个分析人员少熬几个夜,让一个管理者更早发现风险,让一个普通员工在复杂系统里少迷路。
这才是大模型真正该出现的地方。
它不是来炫技的,它是来干活的。
所以,下次再有人说“这个需求我们也上个大模型吧”,不妨先问一句:
“这个问题,真的需要大模型吗?”
如果答案是需要,那就认真设计。
如果答案是不需要,那也别不好意思。
毕竟,一个成熟的技术人,最大的克制,不仅是知道什么时候该用大模型,而是知道什么时候不该用。
你有没有遇到过那种“为了AI而AI”的项目?
看上去很智能,用起来很鸡肋;
汇报时很先进,落地后很安静;
名字叫智能体,实际像个会写小作文的按钮。
欢迎留言说说:你见过最离谱的大模型需求是什么?