多模态理解模型处理的图像、视频、音频可能包含个人隐私信息(如人脸、声纹、地理位置、身份证件等)。在将此类数据发送至云端 API 之前,应进行评估并采取必要的脱敏措施。部分平台(如腾讯云 TokenHub)明确承诺不会将用户请求与模型返回的数据用于模型训练或提供服务以外的场景,用户在选择服务平台时可关注此类数据使用政策。
多模态理解模型可能被用于生成或分析敏感内容,包括政治内容、暴力内容、成人内容等。使用方应建立内容审核机制,确保模型输出符合当地法律法规和平台规则。在面向公众的服务中,建议在模型调用前后均设置内容安全过滤层。
用于训练多模态理解模型的数据集可能涉及版权问题,特别是在使用网络爬取数据或第三方内容时。使用方在上传自有数据(如企业文档、产品图片)进行模型微调或内容理解时,应确保拥有相应的知识产权或使用权,避免侵权风险。
多模态理解模型的输出可能存在错误、偏见或幻觉,使用方不应将模型输出作为最终决策的唯一依据,特别是在医疗诊断、金融投资、法律判断等高风险的领域中。建立人机协同的审核机制,对模型输出进行必要的验证和确认,是负责任地使用多模态 AI 技术的重要实践。