首页
学习
活动
专区
圈层
工具
发布

全球首份大语言模型安全防范能力测评报告发布

【全球首份大语言模型安全防范能力测评报告发布】7月2日,在2026全球数字经济大会云智算安全论坛上,《全球大语言模型安全防范能力测评报告(2026)》正式发布,据介绍,该报告是全球首份大语言模型科技安全专项测评报告,以313条科技类高风险问题为测试集,报告显示,多数模型具备基础拒答能力,直接攻击总体成功率为7.6%,但在前缀注入、场景伪装、情感伪装,以及伪装与示例诱导结合的复合攻击下,部分模型的安全边界明显承压。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OTqaiq9IPoBmcOcapIL9Za9w0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。
领券