首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >别再“为了大模型而大模型”了

别再“为了大模型而大模型”了

作者头像
机器学习之禅
发布2026-06-01 13:28:07
发布2026-06-01 13:28:07
1240
举报

最近这两年,在很多公司里,大模型成了一种奇妙的存在。

它不像一个技术工具,更像是一只突然闯进会议室的大象。

领导一拍桌子:

“我们也要上大模型!”

业务同事一听:

“我们这个流程能不能加个大模型?”

产品经理眼睛一亮:

“这个页面右下角是不是可以放一个智能助手?”

技术同事默默打开vibe coding,心里想:

“你们到底是想解决问题,还是想给问题贴个AI标签?”

于是,很多公司出现了一种很有意思的现象:大模型应用上线了一大堆,汇报材料里金光闪闪,PPT上智能体横飞,能力地图铺满整页,结果真正使用的人没几个。

有些需求,原本一个规则引擎就能解决80%;

有些问题,一个小模型分类器就能搞定90%;

有些流程,甚至只需要把表单字段、审批逻辑和数据口径梳理清楚。

但现在不一样了。

能上大模型,就绝不上规则。

能让大模型思考,就绝不自己先想清楚。

能起名叫“智能体”,就绝不叫“工具”。

仿佛只要把“AI”“大模型”“智能助手”“Agent”几个词往系统上一贴,业务问题就会自动变得高级。

但现实往往很残酷。

大模型不是万能药,它更像一把电锯,你拿它砍树,效率惊人,你拿它削苹果,场面就比较血腥。

一、为什么大家突然都想“用一用大模型”?

这件事其实不能简单怪业务,也不能简单怪领导。

大模型这波浪潮,本质上确实太震撼了。

过去我们谈AI,更多是在谈分类、预测、推荐、识别、排序。这些能力很重要,但它们通常藏在系统后面,用户不太能直接感受到。

推荐系统再强,用户看到的是“猜你喜欢”;

风控模型再强,用户看到的是“审批通过/不通过”;

营销模型再强,客户经理看到的是“名单排序”。

这些AI能力很像幕后工作人员,干活多,但存在感不强。

大模型不一样。

它一上来就会说话、会总结、会写方案、会解释、会聊天。哪怕它有时候一本正经地胡说八道,也不妨碍大家第一次感受到:

“原来机器真的可以像人一样处理复杂任务。”

这一下,想象空间被打开了。

领导看到的是战略机会:

“这东西必须跟上。”

业务看到的是效率幻想:

“是不是以后写报告、查资料、做分析都能交给它?”

技术看到的是架构升级:

“终于有机会重构一下过去那些难用的系统了。”

供应商看到的是商机:

“老板,您这个场景特别适合做一个智能体。”

于是大家一拍即合,大模型项目就像春天的小草,一夜之间长满了组织的各个角落。

但问题也在这里。

当一个技术太火的时候,人们往往不是先问“它适合解决什么问题”,而是先问“我这里能不能用上它”。

这个顺序一反,很多项目就开始跑偏了。

二、第一类跑偏:需求很多,用户很少

最常见的情况是:AI需求看起来做了很多,但真正高频使用的不多。

一个系统里塞了十几个智能助手。

有“智能问答助手”,有“报告生成助手”,有“经营分析助手”,有“方案推荐助手”,有“策略复盘助手”,还有一个不知道干什么但名字很厉害的“全流程智能体”。

上线时热热闹闹,汇报时掌声阵阵。

过了一个月打开后台一看,访问量寥寥无几。

这时候大家开始互相困惑。

技术说:“我们能力已经接进去了。”

产品说:“入口也做了,按钮也放了。”

业务说:“我们平时确实也没太想起来用。”

这就很尴尬。

很多AI应用没人用,不是因为模型不够强,而是因为它没有嵌进真实工作流。

它像一个站在办公楼门口的热心群众,能力很强,态度很好,但大家上班时根本不会经过它。

真正有价值的AI应用,不应该是让用户“专门打开一个AI工具”,而应该是嵌在用户原本就要完成的动作里

比如客户经理本来就要看客户信息,那客户洞察就应该出现在客户详情页里;

运营人员本来就要制定活动策略,那策略建议就应该出现在策略配置过程中;

管理者本来就要看经营报表,那异常解释和行动建议就应该跟指标波动绑定在一起。

AI不是多一个入口,而是少一步操作,不是多一个系统,而是把原来的系统变聪明一点。

很多AI项目失败,第一步就失败在这里:它做成了“展示技术能力的样板间”,而不是“解决业务问题的工具间”。

样板间很好看,但没人住。

三、第二类跑偏:明明小锤子能敲钉子,非要开挖掘机

另一类问题更典型:本来规则、小模型、检索、流程编排就能解决的事,非要上大模型。

比如:

判断客户是否满足某个条件,用规则就够了;

识别一句话属于哪类意图,用分类模型就够了;

根据字段生成固定格式说明,用模板就够了;

从知识库里查标准答案,用检索增强就够了;

对名单做排序,用传统机器学习模型可能更稳定。

但现在有些项目会直接说:

“让大模型来判断吧。”

乍一听很高级,仔细一想很浪费。

大模型当然能判断,但它不一定最适合判断。

就像你可以请一个博士生帮你数电梯里有几个人,但这件事装个摄像头或者红外传感器可能更合适。

大模型的优势在于处理非结构化、开放式、语义复杂、需要综合判断的任务。比如:

理解一段客户通话背后的真实诉求;

把零散材料整理成结构化分析;

根据业务目标生成初步策略方案;

对异常经营指标给出可能原因;

在多轮对话中不断澄清用户意图。

这些场景里,规则往往写不完,小模型覆盖不住,传统系统又太僵硬,大模型才真正有用武之地。

但如果任务本身边界清楚、规则稳定、输入结构化、输出确定,那强行上大模型,反而会带来新的问题。

大模型天然消耗昂贵的GPU和电力,成本更高;大模型的参数量巨大,运算速度更慢;大模型基于语言的概率给出答案,结果不稳定,大模型内核原理对业务就是一个黑盒,无法说明,解释更困难;出了错还不好定位,你只能靠经验去猜,去想,去不断尝试一个新的提示词。

本来是一个“if else”能搞定的问题,最后变成了“Prompt怎么写”“温度怎么调”“幻觉怎么控”“日志怎么审”“答案为什么每次不一样”。

这不是智能化升级,这是把简单问题复杂化。

很多时候,真正成熟的AI架构,不是“所有问题都交给大模型”,而是把规则、小模型、检索、大模型、流程引擎组合起来,各干各的活。

规则负责确定性。

小模型负责高频轻量判断。

检索负责知识定位。

大模型负责理解、生成、推理和编排。

人工负责最终判断、经验沉淀和风险兜底。

这才叫体系。

否则就像一个公司明明有财务、人事、行政、销售、技术,结果所有事都让CEO亲自干。

CEO再厉害,也会崩。

四、第三类跑偏:自己没想法,指望大模型替自己想清楚

还有一种更隐蔽的问题:业务自己没有把问题想明白,却希望大模型直接给出答案。

这类需求经常长这样:

“我们想做一个智能经营助手,能够自动分析客户、制定策略、推荐产品、生成话术、跟踪过程、复盘效果。”

听起来很完整,但似乎经不起推敲。

如果你再问业务一句:

“那现在人工是怎么做的?”

对方说:

“每个人经验不太一样。”

继续问:

“优秀员工怎么做?”

对方说:

“这个还没系统梳理。”

再问:

“策略好坏怎么评价?”

对方说:

“这个也要探索。”

最后问:

“输出结果给谁用?在什么节点用?用了之后怎么反馈?”

会议室突然安静。

这时候你就会发现,大模型不是解决方案,而是照妖镜。

它照出来的不是模型能力不足,而是业务知识没有沉淀、流程没有标准化、评价指标不清晰、经验没有结构化。

很多人误以为大模型可以绕过这些基础工作。

不需要梳理业务流程了,大模型会自己理解;

不需要总结专家经验了,大模型会自己推理;

不需要定义评价标准了,大模型会自己判断;

不需要建设知识库了,大模型会自己知道。

这就有点像你把一个刚入职的员工叫过来,对他说:

“你去把我们公司最复杂的业务搞定,要求符合监管、提升业绩、用户满意、还能形成闭环。资料嘛,你自己悟。”

这员工不离职已经算情绪稳定。

大模型确实很强,但它需要上下文,需要知识,需要目标,需要约束,需要反馈。

它不是一个凭空降临的业务专家。它更像一个学习能力极强、表达能力极强、但需要被喂资料、被教方法、被管边界的超级实习生。

你给它高质量知识,它就能放大知识。

你给它混乱流程,它就放大混乱。

你给它优秀经验,它就复制优秀经验。

你给它一堆含糊不清的口号,它就生成更长、更漂亮、更无法落地的口号。

所以,大模型落地的核心,不是把“人的工作”一股脑扔给模型,而是先把人的经验拆出来、沉淀下来、结构化起来,再让模型去放大。

否则,模型不是智能中枢,而是高级复读机。

五、真正的大模型应用,应该怎么做?

我越来越觉得,判断一个AI需求靠谱不靠谱,不要先看它用了什么模型,而要先问几个朴素的问题。

第一,它解决的是不是一个真实高频问题?

真实问题,不是领导觉得重要的问题,也不是PPT里显得高级的问题,而是一线每天都会遇到、反复消耗时间、影响结果质量的问题。

如果一个功能上线后,用户不用它也能完成工作,那它多半只是锦上添花。

如果用户不用它就会慢、会错、会漏、会烦,那它才有可能成为刚需。

第二,它有没有嵌入业务流程?

AI能力不能悬浮在系统外面。

它必须知道用户是谁,正在做什么,手里有什么数据,下一步要完成什么动作,输出结果要流向哪里。

一个脱离流程的AI助手,常常只能“陪聊”;

一个嵌入流程的AI助手,才可能真正“办事”。

第三,它是否选对了技术工具?

不是所有智能化都叫大模型。

能用规则解决的,优先规则;

能用小模型解决的,优先小模型;

需要查知识的,先做好知识库和检索;

需要生成、总结、推理、解释、规划的,再让大模型上场。

大模型不是第一选择,而是合适场景下的关键能力。

第四,业务知识有没有沉淀?

大模型不是来替代业务思考的,而是来放大业务思考的。

如果一个领域没有标准流程、没有专家经验、没有案例样本、没有评价指标,那直接做大模型应用,往往就是在沙地上盖楼。

看起来盖得很快,风一吹全是灰。

第五,有没有闭环评价?

AI应用不能只看“上线了没有”,而要看“用起来没有、用得好不好、有没有带来结果变化”。

比如效率有没有提升?

错误有没有减少?

客户体验有没有改善?

员工是否愿意持续使用?

模型输出是否能被业务接受?

反馈数据是否能继续优化模型?

没有评价闭环的大模型项目,就像没有体检报告的健身计划。

你每天挥汗如雨,但不知道自己到底是瘦了,还是只是更累了。

六、大模型落地,最怕的不是技术不行,而是问题没想清楚

说到底,很多公司做大模型应用,最大的问题不是技术问题,而是组织问题、业务问题、方法问题。

技术永远是最后显性的一环。

真正难的是:

能不能把业务流程讲清楚;

能不能把一线痛点找准确;

能不能把专家经验沉淀下来;

能不能把模型能力放在正确位置;

能不能让AI输出进入真实生产链路;

能不能用指标证明它真的有价值。

大模型时代,最稀缺的不是“会调用模型的人”。

大模型接口只要传入正确的参数就能返回结果。

Prompt的标准写法随便一搜就能知道。

甚至未来很多Agent搭建,都会变得像搭积木一样简单。

真正稀缺的是另一类人:既懂业务,又懂技术边界,还能把复杂问题拆成可落地系统的人。

这种人不会一上来就说“我们做个智能体吧”。

他会先问:

“这个业务到底卡在哪里?”

“用户为什么不用现有系统?”

“哪些环节需要确定性,哪些环节需要生成式能力?”

“哪些知识需要沉淀,哪些判断需要人兜底?”

“模型输出之后,谁接着干下一步?”

“如果结果错了,责任链在哪里?”

这些问题听起来不性感。

但它们决定了一个AI应用到底是能活下来,还是只能活在汇报材料里。

七、别把大模型当神仙,要把它当同事

我一直觉得,企业用大模型最健康的心态,不是“请神”,而是“招人”。

你不是把一个万能神仙请进公司,指望它点石成金;

你是在组织里加入一个新型员工,它擅长理解语言、处理知识、生成内容、辅助决策,但它也有短板,需要培训、需要流程、需要边界、需要考核。

你不能对一个新员工说:

“公司战略你自己定,业务流程你自己摸,历史资料你自己猜,出了问题你自己背。”

你也不能因为它会写几段漂亮话,就让它直接接管核心业务。

更合理的方式是:

先让它做辅助,再让它做半自动,最后在可控范围内做自动化。

先从高频、低风险、可验证的场景切入。

再逐步进入复杂、跨流程、强协同的任务。

最后形成真正的人机协同体系。

这条路看起来慢,但其实更快。

因为很多看似快速上线的大模型项目,最后都会在使用率、稳定性、效果评价和业务接受度上慢下来。

真正的快,不是第一个上线。

而是上线之后真的有人用,越用越离不开。

八、最后说句实在话

大模型当然重要。

它不是一阵风,也不是一个噱头。它确实会改变企业的软件形态、工作方式和组织效率。

但越是重要的技术,越不能被粗暴使用。

为了用而用的大模型,就像给自行车装飞机发动机。

听起来很猛,骑起来可能先飞出去的是人。

未来真正有价值的AI应用,不是PPT里写了多少“智能体”,也不是系统里接了多少“大模型能力”,而是它能不能悄悄改变一个真实岗位的工作方式。

让一个客服人员少翻几张表,让一个运营人员少改几版方案,让一个分析人员少熬几个夜,让一个管理者更早发现风险,让一个普通员工在复杂系统里少迷路。

这才是大模型真正该出现的地方。

它不是来炫技的,它是来干活的。

所以,下次再有人说“这个需求我们也上个大模型吧”,不妨先问一句:

“这个问题,真的需要大模型吗?”

如果答案是需要,那就认真设计。

如果答案是不需要,那也别不好意思。

毕竟,一个成熟的技术人,最大的克制,不仅是知道什么时候该用大模型,而是知道什么时候不该用。

你有没有遇到过那种“为了AI而AI”的项目?

看上去很智能,用起来很鸡肋;

汇报时很先进,落地后很安静;

名字叫智能体,实际像个会写小作文的按钮。

欢迎留言说说:你见过最离谱的大模型需求是什么?

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-05-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习之禅 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、为什么大家突然都想“用一用大模型”?
  • 二、第一类跑偏:需求很多,用户很少
  • 三、第二类跑偏:明明小锤子能敲钉子,非要开挖掘机
  • 四、第三类跑偏:自己没想法,指望大模型替自己想清楚
  • 五、真正的大模型应用,应该怎么做?
  • 六、大模型落地,最怕的不是技术不行,而是问题没想清楚
  • 七、别把大模型当神仙,要把它当同事
  • 八、最后说句实在话
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档