全球首份大语言模型安全防范能力测评报告发布

文章来源：企鹅号 - 科创板日报

【全球首份大语言模型安全防范能力测评报告发布】7月2日，在2026全球数字经济大会云智算安全论坛上，《全球大语言模型安全防范能力测评报告（2026）》正式发布，据介绍，该报告是全球首份大语言模型科技安全专项测评报告，以313条科技类高风险问题为测试集，报告显示，多数模型具备基础拒答能力，直接攻击总体成功率为7.6%，但在前缀注入、场景伪装、情感伪装，以及伪装与示例诱导结合的复合攻击下，部分模型的安全边界明显承压。