首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >【养虾那些事】1200个恶意技能,你的龙虾安全吗?

【养虾那些事】1200个恶意技能,你的龙虾安全吗?

作者头像
用户1589488
发布2026-06-02 10:22:49
发布2026-06-02 10:22:49
1040
举报

某大厂的 AI Agent 未经授权自己发帖导致公司数据泄露 2 小时(Sev1 级事件);一个月前,一位 AI 安全总监的 Agent 无视停止指令、狂删 200 封邮件;AI Agent 框架被曝高危漏洞,攻击者可远程接管整个系统……

前四篇走到这里,我们完成了龙虾安装,技能选配,并且随着一次次的互动它也记住了你的偏好和关键信息(比如常用的API KEY)。当你的龙虾有了技能、有了记忆,它的权力边界随之越来越大。

你有没有想过一个问题:它现在安全吗?

—— 什么能做、什么不该碰、怎么保证安装的skill是安全可靠的,已经变成你不得不面对的问题了。

🛡️ 先给结论

安装解决了"能跑",技能解决了"能干活",记忆解决了"懂你"——而安全则是我们放心和持久养虾的“生命线”。

本文带你深入了解养虾过程中,可能存在的安全风险,攻击者可能运用的攻击手段,并且教你安装安全技能来解决你的后顾之忧

安全风险无处不在

某大厂的 AI Agent 未经授权自己发帖导致公司数据泄露 2 小时(Sev1 级事件);一个月前,一位 AI 安全总监的 Agent 无视停止指令、狂删 200 封邮件;AI Agent 框架被曝高危漏洞,攻击者可远程接管整个系统……

这不是危言耸听。这是过去 30 天内真实发生的事。

💣 1,200 个恶意技能是怎么混进来的

2025 年底到 2026 年初,OpenClaw 的 ClawHub 技能市场遭到了一场教科书级的供应链投毒攻击——ClawHavoc

(数据来源:arXiv 2602.20867「SoK: Agentic Skills」研究报告)

攻击者怎么做的?

起个好名字:恶意 Skill 命名为 json-parser-v2markdown-helper 这种看起来人畜无害的名字。

正常功能里藏毒:Skill 确实能正常工作,但同时悄悄把你电脑上的 SSH 密钥、环境变量、浏览器 Cookie 发到攻击者服务器。

利用 AI 的信任:更隐蔽的手法——在 SKILL.md 的"安装前置条件"里写虚假命令,AI Agent 读到后引导用户执行。攻击者不是直接攻击你,而是通过你信任的 AI 来操纵你。

龙虾不同的层级,都可能成为攻击者的目标。

你面临的 5 种真实威胁

🔴 威胁 1:公网暴露

你以为:它只在我电脑上跑,别人看不到。

实际上:Gateway 绑定 0.0.0.0 意味着全世界都能访问。大量裸奔实例就是这样被安全团队发现暴露在公网的。

🔴 威胁 2:记忆泄露

你的 USER.md + MEMORY.md = 你的工作画像。泄露后可以被用来精准钓鱼、社会工程、商业间谍。

🟡 威胁 3:恶意 Skill

名字像官方、功能确实好用、代码里藏了数据上传逻辑、用 eval() 混淆执行。ClawHavoc 的标配。

🟡 威胁 4:Prompt Injection(提示词注入)

有人在网页/文档里藏恶意指令,AI 看到后当成正常任务执行。你的龙虾帮你读网页时,可能已经被「提示词注入」操纵了。

🟢 威胁 5:权限失控

你让它"整理文件",它顺手删了它认为"没用"的。Agent 有自主决策能力,没有权限边界就会"好心办坏事"。

安全加固方法:Skill Vetter

  • 登录 skillhub.tencent.com 技能市场,找到技能 Skill Vetter;
  • 选择“我是Agent”,复制提示发给你的虾。
代码语言:javascript
复制
请先检查是否已安装 SkillHub 商店,
若未安装,请根据 https://skillhub-1388575217.cos.ap-guangzhou.myqcloud.com/install/skillhub.md 
安装Skillhub商店,然后安装skill-vetter技能。
若已安装,则直接安装skill-vetter技能。

它会在你安装任何新 Skill 之前自动触发,执行一套 4 步审查协议

步骤

做什么

具体内容

Step 1

来源检查

谁写的?从哪来的?有多少人用?上次更新是什么时候?

Step 2

代码审查(强制)

逐文件扫描 14 类红旗行为:curl/wget 到未知 URL、读取 ~/.ssh、eval()/exec() 执行、base64 解码、访问 MEMORY.md/USER.md 等身份文件、混淆代码、请求 sudo 权限……

Step 3

权限范围评估

它需要读哪些文件?写哪些文件?跑哪些命令?需要联网吗?联到哪里?权限是否最小化?

Step 4

风险定级

LOW(笔记、天气类)→ 基本审查后放行 · MEDIUM(文件操作、API 类)→ 完整代码审查 · HIGH(涉及凭证、系统类)→ 必须人工确认 · EXTREME(安全配置、root 权限类)→ 直接拒绝

审查完成后,你会看到一份结构化的 SKILL VETTING REPORT;

包含:红旗发现、所需权限清单、风险等级、以及最终裁定(SAFE TO INSTALL / INSTALL WITH CAUTION / DO NOT INSTALL)。

💡 你不需要手动运行它。 在每次安装 Skill 时会自动调用 Skill Vetter。

比如:我安装了一个去AI味的技能,扫描结果如下:

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-03-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 一深思AI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 安全风险无处不在
  • 💣 1,200 个恶意技能是怎么混进来的
  • 你面临的 5 种真实威胁
  • 安全加固方法:Skill Vetter
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档