最近 AI 圈最大的变化,不是模型越来越会聊天了,而是 AI 开始真的「动手干活」。
从自动操作电脑、自动写代码,到一句话完成复杂任务,越来越多 AI 智能体开始像“数字员工”一样工作。
过去几个月,国内也冒出了大量“龙虾”产品。 大家都在卷同一件事:谁能真正让普通人,把 AI 当工具人用起来。
但我实际体验下来发现,很多产品看起来很酷,真正长期用的时候,还是会卡在这几个核心问题上。
这些问题不解决,龙虾产品无法成为普通人办公使用的工具。
我目前用过的两款国产龙虾产品都很好的解决了以上三个问题。

接下来我就来对比横评下这两款产品:
一款是来自百度的搭子DuMate,另外一款是腾讯的WorkBuddy。
它们两在刚才我提到的三个问题上都做了优化处理,让我看到了“龙虾”类产品真正走向实用的可能:
百度搭子每天免费刷新 1000 积分,全程无额外费用。
WorkBuddy注册送5000积分,每天领取100积分。
这意味着对于绝大多数日常自动化任务,用户可以零成本、无负担地长期使用。
百度搭子 一键安装,开箱即用,内置丰富技能。
WorkBuddy 内置技能市场,支持一键快捷添加。

百度搭子和WorkBuddy采用的都是独立工作区 + 沙箱环境 + 敏感操作手动确认。
所有对本地文件的操作都运行在一个安全的沙箱环境中。这意味着任何未经用户明确授权的操作,都无法触及系统核心或跨区访问敏感数据。所有涉及文件删除、修改等敏感行为,都必须经过用户的手动点击确认才会执行。这种“事前隔离+事中授权”的双重机制,从根源上杜绝了数据泄露的风险。
接下来让我来通过三个贴近实际场景的实战案例进行对比。
面对23张类型、日期、金额各异的杂乱发票,它们表现如何?
这个任务主要考验他们的多维度能力:
提示词:
帮我整理下发票:
1.根据发票类型进行文件夹分类
2.做成Excel表格统计总数
3.根基不同类型消费做图表分析
百度搭子

第一步:分类文件夹没有问题,每个文件夹里面的发票也正确的放入了对应的文件夹。


第二步:表格内容整体有点小问题,但是销售方和发票代码有3个信息未补全,不过不影响最后的计算。

第三步:可视化表格没问题,正确的显示了比例以及选择了合适的图片展示。



第一步:从创建文件夹分类没问题,但是发票文件移动有问题,明明有餐饮发票,相关文件夹为空。


结果我找了下被划分到了其他服务类发票。

第二步:Excel表格中金额信息提取不完整,只提取了打车发票金额。

第三步:图表分析因为数据本身没有提取完整,所以结果也是错的。

现在 vibe coding 已经成为一种潮流了,但是如果需要上线直接可以使用还要搞定环境、服务器、域名的问题,对于小白来说还是有一定难度的。
这个技能就不做对比了,因为本质上是调用秒哒的能力,唯一的区别就是百度搭子内置了秒哒Skill,WorkBuddy需要额外安装,效果应该都是一样的。
百度搭子直接在任务输入框用“/”斜杠符号呼出已安装的技能列表,选择miaoda-app-builder技能,然后输入你的想法。
miaoda-app-builder 帮我做一个番茄钟小程序,极简风格,MVP版本

根据系统指引在秒哒官网获取Key并填入。



只需要等待几分钟即可完成一个直接上线的应用程序。
一个可以直接上线使用的番茄钟应用程序就搞定了。
无需安装任何开发工具,无需购买服务器,更无需进行麻烦的域名备案。

大家可以扫码亲自体验。
程序复杂度的增加只会线性增加等待时间,但开发门槛被彻底抹平。
开发一款能用的软件这件事,一句话就搞定了。

我们都知道 AI 新知识层出不穷,那么我们该如何快速学习并内化?
我的学习方法就是先全面搜索指定主题,然后一次性输出多种形式的学习材料。
先全面搜索下Agent Skills然后用这个主题输出一份详细的教学文档MD格式、
一个可以演示的PPT、一个精美的HTML报告放在学习文件夹创建Skills文件夹
把学习资料放在里面。
我为什么选择三种形式?
我认为MD文档更适用于详细学习,内容较长,能够更详细的理解这个知识点的方方面面,还支持修改。
PPT:结构清晰,视觉聚焦,最适合用来分享和讲解。
这背后是“费曼学习法”的实践:以教为学,通过准备分享材料来加深自己的理解。
HTML报告:交互性强,样式精美,阅读体验最佳,非常适合对外展示成果或个人知识库。
百度搭子和WorkBuddy都给到了非常详细的内容,文档都有差不多1.2万字。

但是从内容方向上有比较大的差异,DuMate给的是教你Skills是什么,从源起到价值再到技术架构。


WorkBuddy给到的是Skills生态以及Skill推荐安装列表,没有详细的介绍Skills的价值以及技术架构。


以上两份内容都是有价值的,但是从提示词来看百度搭子给到的更符合需求,内容更适合学习 Agent Skills。
最后再看看百度搭子和WorkBuddy做好的PPT和网页。
百度搭子产出的PPT内容。

WorkBuddy产出的PPT内容。

百度搭子产出的HTML内容。



WorkBuddy产出的HTML内容。



PPT和HTML从布局的多样性上来说WorkBuddy更胜一筹。
看完这三轮对比,其实能很明显感觉到,百度搭子和WorkBuddy这两款国产“龙虾”已经不只是简单照搬OpenClaw了,而是真正在往“普通人能用”的方向去打磨。
这两款产品走的路子也不太一样:
百度搭子给我的感觉就一个字“稳”。 像发票整理这种活儿,特别考验AI对细节的把控,DuMate在文件夹分类、表格提取、图表呈现这些环节都做得挺扎实,基本没出岔子。加上它内置了秒哒Skill,想做个什么小工具,直接一句话就能搞定,体验很顺。
WorkBuddy则更偏向“巧”。 它在内容输出这块确实有亮点,PPT和HTML的布局、视觉呈现都挺用心,出来的东西一看就是花了心思包装过的。但在一些基础能力上,比如数据提取、文件归类,还有提升空间,发票案例里分类错位、金额漏掉的问题,说明它在复杂任务的理解和执行上还不够稳。
我认为AI智能体最核心的价值,其实不是它能做多少事,而是交给它的每件事,能不能把事情做好。
所以职场办公场景我更推荐 百度搭子,它的交付结果相对更稳定更让人放心。
这不仅仅是我个人的感觉,这背后其实也能从数据里看出来。
最近 Baidu 旗下 百度搭子 在 PinchBench 榜单上,直接包揽前两名,成绩分别是 93.3% 和 93.2%。
这个榜单可以理解成:目前 OpenClaw 赛道里,最能测试 AI Agent “真实干活能力”的评测。

同一个模型,百度搭子甚至比模型原厂还会用,背后核心是百度搭子的端云协同 Harness 架构。 简单理解就是:AI 会根据任务和历史操作不断优化自己的执行方式,让不同模型都能稳定发挥出上限能力。
而且不只是能力强,在4月发布的 AI 产品榜单里,百度搭子还以 114.72%的月增速,冲到了 AI 龙虾增速榜第一。
