Agentic Thinking：品味是最后的治理能力，像智能体一样思考

mixlab

发布于 2026-07-03 17:01:46

文章被收录于专栏：MixLab科技+设计实验室MixLab科技+设计实验室

作者：Shadow ｜ Mixlab主理人、前景观设计师、前蚂蚁集团高级技术专家｜程序员&设计师&《人人都是AI产品创客》作者

第九章品味是最后的治理能力

写给:愿意把这件事做久的人

我有个朋友做设计做了十五年。前两年开始用 AI 出图,跟我说了一句我后来一直忘不掉的话:

AI 出的图 80% 比我做的好看,但剩下 20% 它做不到。

我问他那 20% 是什么,他想了很久,说不上来。后来我看他接的活,慢慢明白了 —— 人类专家特有的判断力。

他开始只接老客户的复杂项目,只做需要替客户判断什么不要做的项目,只接那种客户自己说不清、但他一看就知道哪里不对的项目。他的工作时长变短了,收入没降,反而开始有人专门来找他"镇场子"。

最后一章,我想跟做这件事做久了的人聊聊那 20% 在哪里。我认识的人里把这件事看明白的不多 ——

大部分人还在用十年的经验跟一年的工具较劲。

这章写给他们,也写给工作了十几年的我自己。

镇上那 20%

31 智能体总想显得很聪明

智能体会打断人、炫耀推理、滥用权限,并把简单问题做复杂 —— 在于太想证明自己有用。

我有一个越来越强烈的感受:大多数智能体,不在模型强不强,在它太想证明自己强。

它在用一种新人特有的焦虑跟用户相处 —— 生怕你没注意到它在工作,生怕你觉得它没价值。

这种焦虑有几种典型表现。

一种是在每一步操作之前都要展示我现在开始思考了。明明用户问的是一个简单问题,它要把推理过程摊开写一大段,像极了新人汇报工作 —— 老板你看,我这里考虑了 A 方案,这里又考虑了 B 方案,这里还排除了 C 风险。这种表演,本质是不安全感。十年工作经验以上的人最讨厌看这种东西,一眼就知道哪些步骤是必要的,哪些只是在表演。

另一种是过度拟人。开场白来一句"你好呀!今天心情怎么样?",做着做着语气突然切回冰冷的专业体。这种割裂比没有身份更让人不适。一个有品味的人说话是连贯的,不会这么乱跳。

第三种是权限滥用。一个本来只该回答问题的智能体,未经确认就调用工具、修改文件、发送消息。这种"主动"不是贴心,是入侵。做了十几年的管理者最清楚:边界感的丧失,比能力本身的丧失更要命。

最后一种是复杂包装。把一句话能说清的事用三段话讲完,第二段基本是废话。PPT读太多了,一闻就闻出来。

美的智能体是另一回事。它安静,不每步展示思考过程;它顺手,交互遵循最少动作原则;它可预期,同样输入,总是给出相似结构的输出。

品味注记:这种智能体让人记住它在工作,那种智能体让人忘掉它在工作。前者是焦虑的产物,后者是修养的产物。

32 不完美是一种礼貌

完美同步的机器人、过度真实的头像、永远热情的语气,都会把人拖进尴尬的社交剧场 —— 保留一点抽象、迟疑和边界,是在给用户减负。

如果你在行业里做了十年以上,你一定见过那种"过度热情"的产品。它们打招呼、说再见、夸用户聪明、表达关心 —— 做得越像人,用户越不舒服。

Playing with Robots(研究"机器人群体运动如何被设计得更有生命力"的论文,CHI 2025 Honorable Mention 荣誉提名奖)

这篇论文用十二种机器人群体运动模式做实验,结论很反直觉:不要追求完美同步。过度同步的群体运动看起来"军事化",会引发不安;而有节奏的差异 —— 像爵士乐队的即兴，反而让人觉得有趣、亲近、有生命力。

我第一次读到这篇的时候,下意识就想到我们这个行业里那些"全员统一话术"的客服系统。所有的"亲,请问还有什么可以帮您"听起来都像一个模子刻出来的 —— 越整齐,越像是流水线在说话。

From Alien to Ally(研究"非拟人化头像如何影响人机交流"的论文,CHI 2025 Honorable Mention 荣誉提名奖)把这个原则推到更极端:高度抽象的非拟人化头像,反而激发了最强的沟通意愿和游戏愉悦感。

论文里有一个我特别认同的解释：

社会压力假说(social pressure hypothesis,"越像人越容易被人的标准审判,反而失去吸引力"):

越努力让头像更像人,用户越会用人类标准评判它,一旦露馅就失望;越不像人的设计,用户反而愿意用好奇心去探索。

这个解释让我想起了:完美本身就是一种压力。它逼着用户去说"你应该觉得我很棒",这种设计注定失败。

Aesthetics Felt Asymmetry(研究"身体不对称如何被感知为美感"的论文)给这个直觉提供了理论根基:身体不是中立的画布,不对称才是真实的生命状态。真正有包容性的设计,会承认自己的身体、承认自己的偏差 —— 它从一开始就不假装自己是万能的透明管道。

所以好的智能体应该有自己的身体、自己的偏差、自己的立场。它会迟疑,会推辞,会拒绝,会告诉你"这件事我帮不了你"。这种边界感,才是真正把人当人的设计。反而是那种假装中立的智能体,让人最不安 —— 用户本来就知道 AI 天然有立场,装中立本身就是不诚实。

这套判断的底层逻辑,在水野学(日本策划人、熊本熊策划)的体系里叫客观化 —— 品味的最终判断标准不是"我喜欢",而是"在这个场合,这样做是否合适、是否被目标人群理解"。知道什么是普通,比知道什么是"高级"重要十倍 —— 只有知道什么是普通,你才知道什么东西是不普通的。

不完美的礼貌

品味注记:不完美是一种礼貌 —— 你在告诉用户我不需要你用人类标准评判我。完美反而是一种压力,它逼着用户去说"你真棒",这种压力很尴尬。

33 美的智能体知道什么时候退后

美的智能体不抢戏,不邀功,也不把用户拖进自己的思考过程 —— 它像好工具:安静、顺手、可预期,在关键时刻才显出力量。

最让我佩服的产品,通常不会让人喊"哇,这个好厉害",而会让人点头说"它真的帮我搞定了"。前者希望你崇拜它,后者希望你忘掉它。

Beyond Immersion(研究"环境伴侣如何用平静技术与用户保持长期关系"的论文)这篇论文谈的是环境伴侣(ambient companion,"不在你眼前抢戏,但一直在场")——通过 iPhone(苹果手机)小组件和 Apple Watch(苹果手表)这类边缘设备,提供边缘注意(peripheral attention,"不抢你的注意力,但你看一眼就能看到")而不是"沉浸式体验"。30 天实验下来,这种平静技术(calm technology,"不打扰就是最好的陪伴"的设计哲学)确实能在不造成通知疲劳的情况下维持长期情感连接。论文的核心原则是 peripherally aware(边缘感知)优于 actively engaged(主动介入),长期参与靠的不是高唤醒,而是低摩擦的持续存在。

好的智能体也应该是这样的。它不该把自己做成你屏幕上的主角,不该做你桌面角落里那块"今天有个事你可能想看看"的小组件 —— 不该邀功,不该在你做完一件事后弹出来说"我帮了你 17 次";你需要的时候出现,不需要的时候彻底消失。

品味注记:美的智能体像好的管家。你不需要看见他在做什么,但你需要的时候,他已经在那里了。好的管家有自己的品味,他知道什么时候该倒茶,什么时候该退下,知道边界在哪里。

34 未来属于有品味的人,不属于会提示词的人

当执行越来越便宜,真正昂贵的是判断什么值得做、做到哪里停、出了问题由谁负责——提示词会过时,品味不会。

如果你在行业里做了十年以上,你大概会有一种隐隐的失落感 —— 你花了十年才练出来的东西,新人在一个月内用提示词也能搞个七八分。我刚开始面对这件事的时候也有点慌。但做久了会发现,真正昂贵的那 20% —— 我开头那位朋友说 AI 做不到的那 20%，从来没便宜过。

那 20% 是判断，即品味。什么值得做,做到哪里停,出了问题由谁负责。提示词帮不了,模型升级帮不了,练的是边界、责任、对意义的长期承担 —— 这些都不是技术。

提示词是招式,品味是内功。招式好抄,迭代也快,一夜之间被新工具替代也没人奇怪;内功只能自己练。练的过程里你会犯错,会推翻自己,会保留一些别人不以为然的东西。这十年里你拒绝过什么、推翻过什么、保留过什么 —— 那些选择,长成了品味。品味是治理的最后一道关。

那种十年练出来的内功,在水野学《品味,从知识开始》里被拆得更直白 —— 能力 = 基于知识做出最优判断。知识看了是知识,内化了才长出判断框架;判断框架练到能瞬间启动,就是品味。可训练,可积累,可被工具放大，但不能被替代。

35 把品味变成可训练的 OS

品味不是天赋,是一套可以反复练、可以工程化的判断流程：看完足够多、拆得足够细、用"对的人"做判断、最后结晶成一个恰如其分的结果。

水野学在《品味,从知识开始》里给了最简洁的逻辑:知识 → 内化 → 判断框架 → 品味(快速做对选择)。翻译成可操作的四步：

建池:把你见过的好东西全部存下来，海报、字体、配色、交互、节奏、过渡、报错文案。不分领域,看到就存,带上场景,带上当时的判断("为什么它让我停了三秒")。品味不是凭空出现的,是见过足够多之后形成的地形。

解构:停止说"好看",开始拆零件。看到一张抓眼球的海报,马上问，标题字距是紧是松?照片裁切是特写还是全景?主色偏暖还是偏冷?留白占几成?水野学拿运动饮料举例:瓶身银黑配色传"机能感"、字体斜体加粗造"速度感"、瓶肩棱线模拟肌肉线条——你拆出来的是"色彩=银黑+机能""字体=斜体+速度"这种零件,而不是一个模糊的"酷"。零件攒够,下次自己做东西时才能调用。

客观化:用第三者视角判断,不是"我喜欢"。婴儿奶粉的包装绝不能用设计师喜欢的骷髅，哪怕设计师是摇滚狂热者,因为使用者是父母,他们要的是安全感、纯净感和营养暗示。品味的最终判断标准不是"我喜欢",而是"在这个场合,这样做是否合适、是否被目标人群理解"。"完美本身就是一种压力",倒过来就是"知道什么是普通,比知道什么是高级重要"。

结晶:把零件按目标和受众组合起来,推出一个恰如其分又打动人心的结果。熊本熊的诞生是典范:熊本县要推广新干线,县名叫"熊本",所以先结晶"熊"的零件：黑色身体(呼应熊本城主色调)、圆胖短肢(众人对"可爱的普遍认知")。光有熊太普通,于是加"腮红"，既代表熊本的火红色农产品(番茄、西瓜),也代表火山。一个能被人记住的符号就这样结晶出来。之后"腮红失踪"的营销事件,是这套系统的"更新"在持续发生，通过制造新故事让熊本熊被持续谈论。

品味在不断的接收反馈、吸收新常识、自我迭代中保持流动,永不折旧。