大模型推理 API 是企业 AI 部署中暴露面最大的组件,主要安全威胁包括:凭证窃取,攻击者在公开代码仓库、web 应用漏洞或钓鱼攻击中获取 AI 服务的 API Key,通过"LLMjacking"代理服务滥用受害者的算力配额,单日可造成数万至数十万美元的经济损失;框架漏洞,vLLM、SGLang、Ollama 等推理框架在 2025–2026 年均披露了高危漏洞(如 CVE-2026-22778、CVE-2026-7482),攻击者可利用这些漏洞实现远程代码执行或窃取 IAM 凭证;暴露端点,Ollama 默认绑定 0.0.0.0 且无鉴权要求,全球曾有多达 30 万余台服务器因此漏洞暴露。防护措施包括:在网关层(而非应用代码层)实施鉴权与限额、启用 Token 感知的速率限制(而非简单的请求计数限制)、建立成本异常告警机制、及时修补框架已知漏洞。
提示词注入(Prompt Injection)是指攻击者通过在用户输入中嵌入恶意指令,试图覆盖模型的系统提示词或诱导模型执行非预期操作。在推理模型中,这一问题更为复杂:思维链注入(Reasoning Chain Injection)可影响模型的推理过程,使其在"思考"阶段偏离安全对齐目标;推理消耗攻击(Inference Cost Attack)通过强迫模型进入深度、冗长的推理模式,消耗不成比例的计算资源,造成拒绝服务。防御措施包括:在推理层加入输入净化(Input Purification)、使用分隔符明确区分系统指令和用户输入、对推理模型的思维链输出进行安全过滤、以及通过强化学习提升模型对注入攻击的鲁棒性。
即使推理输入是安全的,模型输出仍可能包含有害内容、个人隐私信息或受版权保护的材料。输出安全过滤通常在推理完成后、返回用户之前执行,包括:内容安全检测,基于规则或辅助模型检测输出中的有害、违法或敏感内容;隐私数据脱敏,识别并遮蔽输出中的身份证号、手机号、住址等个人可识别信息;版权内容过滤,检测输出是否包含受版权保护的长篇文本内容。在企业私有化部署场景中,还需确保输出内容符合行业监管要求(如金融行业的合规披露要求、医疗行业的患者隐私保护要求)。
大模型推理服务的安全性还依赖于底层模型和数据供应链的完整性:模型后门(Model Backdoor)是指攻击者在开源模型权重中植入暗门,使得模型在普通输入下表现正常,但遇到特定触发词时输出恶意内容或泄露敏感信息。防御措施包括:仅使用来源可信的模型权重、对开源模型执行权重完整性验证、在私有数据上执行微调时严格审查训练数据的来源。数据投毒(Data Poisoning)则通过在训练数据中植入恶意样本,使得模型学习到错误的关联,在企业微调场景中风险尤为突出。采用数据溯源(Data Provenance)、差分隐私训练(DP-SGD)和影响函数检测三者叠加,可显著降低此类风险。
腾讯云 TI-ONE 平台在模型与数据供应链安全方面提供了多重保障:平台仅提供来源可信的官方模型权重,支持模型完整性校验;提供数据溯源和版本管理能力,确保训练数据的可审计性;支持私有化部署,满足企业对数据不出域的合规要求。结合腾讯云安全产品(如主机安全、Web 应用防火墙、DDoS 防护等),可构建从模型到推理服务再到基础设施的全方位安全防护体系。