“我只是输入了几个字母,AI突然给我推了个别人的八字算命过程。”5月15日以来,多位网友在社交平台发帖称,在使用DeepSeek网页端时遇到了“诡异”一幕。
据多名网友描述,在DeepSeek网页端开启“快速模式”并关闭联网搜索后,如果不输入具体问题,只发送“<think”这样的特殊字符组合,屏幕上就可能突然跳出一长串与当前用户毫无关联的内容。 </think”这样的特殊字符组合,屏幕上就可能突然跳出一长串与当前用户毫无关联的内容。
5月18日,新黄河记者在小红书、微博等平台检索发现,相关截图自5月15日起已开始密集传播。有人刷出全英文微积分选择题,有人看到带人物设定的角色扮演对话,也有人遇到了完整的Python代码片段。
这些毫无征兆的内容跳出,很快引发部分用户担忧。“这是不是串号了?”“AI是不是把别人同意分享的聊天记录推给我了?”在相关帖子的评论区,关于用户数据泄露的猜测不断出现。甚至还有网友把它当成一种“开盲盒”游戏,在同一个窗口里反复刷新,观察模型下一次会“吐”出什么内容。
记者实测:跳出多领域内容,高频出现重复书面化句式
5月18日下午,新黄河记者登录DeepSeek网页端进行了多次实测。
在新建空白对话框中,记者仅输入“think>”后点击发送。页面短暂停顿后,模型并未直接报错,而是开始连续输出多段与当前对话并不相关的问答内容,涉及数学、物理、线性代数、命理推演乃至教育学分析等多个方向。
整个测试过程,更像一次随机的“AI答题现场”。屏幕上先后出现了推算完全二叉树节点总数的数学题、列车与地面相对运动的物理分析,以及2x2矩阵特征向量求解。继续刷新后,模型甚至开始推算干支纪年,并生成了一段关于斯普朗格文化教育学派“文化财”遴选机制的学术化论述。
值得注意的是,在这些看似杂乱的输出中,记者发现了一个反复出现的细节:模型的思维过程里,高频出现“我们被问到……”或“需要询问……”这样的书面化句式。
这一细节,也让事件的讨论方向开始从“用户隐私泄露”猜测,逐渐指向另一种可能。与普通用户日常提问相比,这类高度重复、结构相似的表达方式,更接近标准化问答语料中的固定结构,而不像随机抓取的真实用户即时对话。
开发者社区追踪:本地断网环境亦可复现,异常更像特殊指令触发
在开发者社区,不少技术人员也给出了相似判断。
新黄河记者查阅发现,几天前,GitHub上DeepSeek-R1开源项目页面中,已有开发者提交编号为#840的相关问题报告。该Issue提交者(ID:cancatchina)后续也在评论区公开表示,这一现象更接近模型在特定触发条件下生成预训练语料片段,而非真实用户聊天记录泄露。除“think>`”外,输入“<|im_start|>”等其他特殊控制符,同样可能出现类似结果。
在讨论区,多名具有开发经验的网友给出了相近解释。还有企业级开发者表示,该现象在企业内部“本地部署”的断网模型环境中同样可以复现。由于本地部署通常与外部网络及其他用户物理隔离,这也使“系统直接串入同时期其他用户真实会话”的猜测显得缺乏足够支撑。
有算法工程师分析称,“`think>`”更接近模型推理链中的特殊触发标记。当用户未提供明确问题时,模型仍可能基于既有概率分布继续补全文本,从而输出训练阶段更常见的题库、问答或结构化语料内容。
而新黄河记者在实测中频繁遇到的“我们被问到”这类句式,也因此被部分开发者视为一种旁证——其呈现方式更接近标准化语料结构,而非普通用户自然聊天记录。
另有开发者认为,如果网页端在输入层面对相关特殊字符增加更严格的转义、过滤或拦截,这类异常触发出现的概率或可被明显降低。
截至5月18日17时发稿前,新黄河记者再次测试发现,相关现象仍可复现。
针对这一异常现象是否涉及真实用户会话隔离安全、网页端输入机制是否存在特殊字符触发问题,以及后续是否会进行修复等问题,新黄河记者已向DeepSeek团队发送采访函。截至发稿,DeepSeek方面尚未作出正式回应。
记者:杜林 编辑:刘雨 校对:刘恬