别再“为了大模型而大模型”了

机器学习之禅

发布于 2026-06-01 13:28:07

2820

最近这两年，在很多公司里，大模型成了一种奇妙的存在。

它不像一个技术工具，更像是一只突然闯进会议室的大象。

领导一拍桌子：

“我们也要上大模型！”

业务同事一听：

“我们这个流程能不能加个大模型？”

产品经理眼睛一亮：

“这个页面右下角是不是可以放一个智能助手？”

技术同事默默打开vibe coding，心里想：

“你们到底是想解决问题，还是想给问题贴个AI标签？”

于是，很多公司出现了一种很有意思的现象：大模型应用上线了一大堆，汇报材料里金光闪闪，PPT上智能体横飞，能力地图铺满整页，结果真正使用的人没几个。

有些需求，原本一个规则引擎就能解决80%；

有些问题，一个小模型分类器就能搞定90%；

有些流程，甚至只需要把表单字段、审批逻辑和数据口径梳理清楚。

但现在不一样了。

能上大模型，就绝不上规则。

能让大模型思考，就绝不自己先想清楚。

能起名叫“智能体”，就绝不叫“工具”。

仿佛只要把“AI”“大模型”“智能助手”“Agent”几个词往系统上一贴，业务问题就会自动变得高级。

但现实往往很残酷。

大模型不是万能药，它更像一把电锯，你拿它砍树，效率惊人，你拿它削苹果，场面就比较血腥。

一、为什么大家突然都想“用一用大模型”？

这件事其实不能简单怪业务，也不能简单怪领导。

大模型这波浪潮，本质上确实太震撼了。

过去我们谈AI，更多是在谈分类、预测、推荐、识别、排序。这些能力很重要，但它们通常藏在系统后面，用户不太能直接感受到。

推荐系统再强，用户看到的是“猜你喜欢”；

风控模型再强，用户看到的是“审批通过/不通过”；

营销模型再强，客户经理看到的是“名单排序”。

这些AI能力很像幕后工作人员，干活多，但存在感不强。

大模型不一样。

它一上来就会说话、会总结、会写方案、会解释、会聊天。哪怕它有时候一本正经地胡说八道，也不妨碍大家第一次感受到：

“原来机器真的可以像人一样处理复杂任务。”

这一下，想象空间被打开了。

领导看到的是战略机会：

“这东西必须跟上。”

业务看到的是效率幻想：

“是不是以后写报告、查资料、做分析都能交给它？”

技术看到的是架构升级：

“终于有机会重构一下过去那些难用的系统了。”

供应商看到的是商机：

“老板，您这个场景特别适合做一个智能体。”

于是大家一拍即合，大模型项目就像春天的小草，一夜之间长满了组织的各个角落。

但问题也在这里。

当一个技术太火的时候，人们往往不是先问“它适合解决什么问题”，而是先问“我这里能不能用上它”。

这个顺序一反，很多项目就开始跑偏了。

二、第一类跑偏：需求很多，用户很少

最常见的情况是：AI需求看起来做了很多，但真正高频使用的不多。

一个系统里塞了十几个智能助手。

有“智能问答助手”，有“报告生成助手”，有“经营分析助手”，有“方案推荐助手”，有“策略复盘助手”，还有一个不知道干什么但名字很厉害的“全流程智能体”。

上线时热热闹闹，汇报时掌声阵阵。

过了一个月打开后台一看，访问量寥寥无几。

这时候大家开始互相困惑。

技术说：“我们能力已经接进去了。”

产品说：“入口也做了，按钮也放了。”

业务说：“我们平时确实也没太想起来用。”

这就很尴尬。

很多AI应用没人用，不是因为模型不够强，而是因为它没有嵌进真实工作流。

它像一个站在办公楼门口的热心群众，能力很强，态度很好，但大家上班时根本不会经过它。

真正有价值的AI应用，不应该是让用户“专门打开一个AI工具”，而应该是嵌在用户原本就要完成的动作里。

比如客户经理本来就要看客户信息，那客户洞察就应该出现在客户详情页里；

运营人员本来就要制定活动策略，那策略建议就应该出现在策略配置过程中；

管理者本来就要看经营报表，那异常解释和行动建议就应该跟指标波动绑定在一起。

AI不是多一个入口，而是少一步操作，不是多一个系统，而是把原来的系统变聪明一点。

很多AI项目失败，第一步就失败在这里：它做成了“展示技术能力的样板间”，而不是“解决业务问题的工具间”。

样板间很好看，但没人住。

三、第二类跑偏：明明小锤子能敲钉子，非要开挖掘机

另一类问题更典型：本来规则、小模型、检索、流程编排就能解决的事，非要上大模型。

比如：

判断客户是否满足某个条件，用规则就够了；

识别一句话属于哪类意图，用分类模型就够了；

根据字段生成固定格式说明，用模板就够了；

从知识库里查标准答案，用检索增强就够了；

对名单做排序，用传统机器学习模型可能更稳定。

但现在有些项目会直接说：

“让大模型来判断吧。”

乍一听很高级，仔细一想很浪费。

大模型当然能判断，但它不一定最适合判断。

就像你可以请一个博士生帮你数电梯里有几个人，但这件事装个摄像头或者红外传感器可能更合适。

大模型的优势在于处理非结构化、开放式、语义复杂、需要综合判断的任务。比如：

理解一段客户通话背后的真实诉求；

把零散材料整理成结构化分析；

根据业务目标生成初步策略方案；

对异常经营指标给出可能原因；

在多轮对话中不断澄清用户意图。

这些场景里，规则往往写不完，小模型覆盖不住，传统系统又太僵硬，大模型才真正有用武之地。

但如果任务本身边界清楚、规则稳定、输入结构化、输出确定，那强行上大模型，反而会带来新的问题。

大模型天然消耗昂贵的GPU和电力，成本更高；大模型的参数量巨大，运算速度更慢；大模型基于语言的概率给出答案，结果不稳定，大模型内核原理对业务就是一个黑盒，无法说明，解释更困难；出了错还不好定位，你只能靠经验去猜，去想，去不断尝试一个新的提示词。

本来是一个“if else”能搞定的问题，最后变成了“Prompt怎么写”“温度怎么调”“幻觉怎么控”“日志怎么审”“答案为什么每次不一样”。

这不是智能化升级，这是把简单问题复杂化。

很多时候，真正成熟的AI架构，不是“所有问题都交给大模型”，而是把规则、小模型、检索、大模型、流程引擎组合起来，各干各的活。

规则负责确定性。

小模型负责高频轻量判断。

检索负责知识定位。

大模型负责理解、生成、推理和编排。

人工负责最终判断、经验沉淀和风险兜底。

这才叫体系。

否则就像一个公司明明有财务、人事、行政、销售、技术，结果所有事都让CEO亲自干。

CEO再厉害，也会崩。

四、第三类跑偏：自己没想法，指望大模型替自己想清楚

还有一种更隐蔽的问题：业务自己没有把问题想明白，却希望大模型直接给出答案。

这类需求经常长这样：

“我们想做一个智能经营助手，能够自动分析客户、制定策略、推荐产品、生成话术、跟踪过程、复盘效果。”

听起来很完整，但似乎经不起推敲。

如果你再问业务一句：

“那现在人工是怎么做的？”

对方说：

“每个人经验不太一样。”

继续问：

“优秀员工怎么做？”

对方说：

“这个还没系统梳理。”

再问：

“策略好坏怎么评价？”

对方说：

“这个也要探索。”

最后问：

“输出结果给谁用？在什么节点用？用了之后怎么反馈？”

会议室突然安静。

这时候你就会发现，大模型不是解决方案，而是照妖镜。

它照出来的不是模型能力不足，而是业务知识没有沉淀、流程没有标准化、评价指标不清晰、经验没有结构化。

很多人误以为大模型可以绕过这些基础工作。

不需要梳理业务流程了，大模型会自己理解；

不需要总结专家经验了，大模型会自己推理；

不需要定义评价标准了，大模型会自己判断；

不需要建设知识库了，大模型会自己知道。

这就有点像你把一个刚入职的员工叫过来，对他说：

“你去把我们公司最复杂的业务搞定，要求符合监管、提升业绩、用户满意、还能形成闭环。资料嘛，你自己悟。”

这员工不离职已经算情绪稳定。

大模型确实很强，但它需要上下文，需要知识，需要目标，需要约束，需要反馈。

它不是一个凭空降临的业务专家。它更像一个学习能力极强、表达能力极强、但需要被喂资料、被教方法、被管边界的超级实习生。

你给它高质量知识，它就能放大知识。

你给它混乱流程，它就放大混乱。

你给它优秀经验，它就复制优秀经验。

你给它一堆含糊不清的口号，它就生成更长、更漂亮、更无法落地的口号。

所以，大模型落地的核心，不是把“人的工作”一股脑扔给模型，而是先把人的经验拆出来、沉淀下来、结构化起来，再让模型去放大。

否则，模型不是智能中枢，而是高级复读机。

五、真正的大模型应用，应该怎么做？

我越来越觉得，判断一个AI需求靠谱不靠谱，不要先看它用了什么模型，而要先问几个朴素的问题。

第一，它解决的是不是一个真实高频问题？

真实问题，不是领导觉得重要的问题，也不是PPT里显得高级的问题，而是一线每天都会遇到、反复消耗时间、影响结果质量的问题。

如果一个功能上线后，用户不用它也能完成工作，那它多半只是锦上添花。

如果用户不用它就会慢、会错、会漏、会烦，那它才有可能成为刚需。

第二，它有没有嵌入业务流程？

AI能力不能悬浮在系统外面。

它必须知道用户是谁，正在做什么，手里有什么数据，下一步要完成什么动作，输出结果要流向哪里。

一个脱离流程的AI助手，常常只能“陪聊”；

一个嵌入流程的AI助手，才可能真正“办事”。

第三，它是否选对了技术工具？

不是所有智能化都叫大模型。

能用规则解决的，优先规则；

能用小模型解决的，优先小模型；

需要查知识的，先做好知识库和检索；

需要生成、总结、推理、解释、规划的，再让大模型上场。

大模型不是第一选择，而是合适场景下的关键能力。

第四，业务知识有没有沉淀？

大模型不是来替代业务思考的，而是来放大业务思考的。

如果一个领域没有标准流程、没有专家经验、没有案例样本、没有评价指标，那直接做大模型应用，往往就是在沙地上盖楼。

看起来盖得很快，风一吹全是灰。

第五，有没有闭环评价？

AI应用不能只看“上线了没有”，而要看“用起来没有、用得好不好、有没有带来结果变化”。

比如效率有没有提升？

错误有没有减少？

客户体验有没有改善？

员工是否愿意持续使用？

模型输出是否能被业务接受？

反馈数据是否能继续优化模型？

没有评价闭环的大模型项目，就像没有体检报告的健身计划。

你每天挥汗如雨，但不知道自己到底是瘦了，还是只是更累了。

六、大模型落地，最怕的不是技术不行，而是问题没想清楚

说到底，很多公司做大模型应用，最大的问题不是技术问题，而是组织问题、业务问题、方法问题。

技术永远是最后显性的一环。

真正难的是：

能不能把业务流程讲清楚；

能不能把一线痛点找准确；

能不能把专家经验沉淀下来；

能不能把模型能力放在正确位置；

能不能让AI输出进入真实生产链路；

能不能用指标证明它真的有价值。

大模型时代，最稀缺的不是“会调用模型的人”。

大模型接口只要传入正确的参数就能返回结果。

Prompt的标准写法随便一搜就能知道。

甚至未来很多Agent搭建，都会变得像搭积木一样简单。

真正稀缺的是另一类人：既懂业务，又懂技术边界，还能把复杂问题拆成可落地系统的人。

这种人不会一上来就说“我们做个智能体吧”。

他会先问：

“这个业务到底卡在哪里？”

“用户为什么不用现有系统？”

“哪些环节需要确定性，哪些环节需要生成式能力？”

“哪些知识需要沉淀，哪些判断需要人兜底？”

“模型输出之后，谁接着干下一步？”

“如果结果错了，责任链在哪里？”

这些问题听起来不性感。

但它们决定了一个AI应用到底是能活下来，还是只能活在汇报材料里。

七、别把大模型当神仙，要把它当同事

我一直觉得，企业用大模型最健康的心态，不是“请神”，而是“招人”。

你不是把一个万能神仙请进公司，指望它点石成金；

你是在组织里加入一个新型员工，它擅长理解语言、处理知识、生成内容、辅助决策，但它也有短板，需要培训、需要流程、需要边界、需要考核。

你不能对一个新员工说：

“公司战略你自己定，业务流程你自己摸，历史资料你自己猜，出了问题你自己背。”

你也不能因为它会写几段漂亮话，就让它直接接管核心业务。

更合理的方式是：

先让它做辅助，再让它做半自动，最后在可控范围内做自动化。

先从高频、低风险、可验证的场景切入。

再逐步进入复杂、跨流程、强协同的任务。

最后形成真正的人机协同体系。

这条路看起来慢，但其实更快。

因为很多看似快速上线的大模型项目，最后都会在使用率、稳定性、效果评价和业务接受度上慢下来。

真正的快，不是第一个上线。

而是上线之后真的有人用，越用越离不开。

八、最后说句实在话

大模型当然重要。

它不是一阵风，也不是一个噱头。它确实会改变企业的软件形态、工作方式和组织效率。

但越是重要的技术，越不能被粗暴使用。

为了用而用的大模型，就像给自行车装飞机发动机。

听起来很猛，骑起来可能先飞出去的是人。

未来真正有价值的AI应用，不是PPT里写了多少“智能体”，也不是系统里接了多少“大模型能力”，而是它能不能悄悄改变一个真实岗位的工作方式。

让一个客服人员少翻几张表，让一个运营人员少改几版方案，让一个分析人员少熬几个夜，让一个管理者更早发现风险，让一个普通员工在复杂系统里少迷路。

这才是大模型真正该出现的地方。

它不是来炫技的，它是来干活的。

所以，下次再有人说“这个需求我们也上个大模型吧”，不妨先问一句：

“这个问题，真的需要大模型吗？”

如果答案是需要，那就认真设计。

如果答案是不需要，那也别不好意思。

毕竟，一个成熟的技术人，最大的克制，不仅是知道什么时候该用大模型，而是知道什么时候不该用。

你有没有遇到过那种“为了AI而AI”的项目？

看上去很智能，用起来很鸡肋；

汇报时很先进，落地后很安静；

名字叫智能体，实际像个会写小作文的按钮。

欢迎留言说说：你见过最离谱的大模型需求是什么？

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-05-30，如有侵权请联系 cloudcommunity@tencent.com 删除

工作

本文分享自机器学习之禅微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度