近期,DeepSeek V3.1模型被开发者发现存在输出“极”字的bug,引发广泛关注。
多位开发者在调用API进行代码开发时,发现输出结果中频繁出现“极”字,影响正常使用。
问题最初在火山引擎、chutes等平台上被发现,随后扩展至腾讯的CodeBuddy,甚至DeepSeek官方。
国外Reddit平台也出现多个相关讨论,涉及“extreme”、“极”和“極”等关键词。
腾讯CodeBuddy甚至出现插入带“极”字广告的情况,进一步加剧问题严重性。
若开发者未及时发现该问题,直接使用生成的代码可能导致编译失败,影响高精度、结构化输出场景。
目前,问题已指向DeepSeek V3.1模型本身,官方回应称已与团队取得联系,将在近期版本中修复。
在问题完全解决前,已有网友提出应对方案,如小红书用户@大模型产品经理分享的提示词缓解方法。
该方法主要通过禁止特定符号序列模式,适用于调用API的第三方平台。
知乎用户黄哲威分析指出,该bug可能与数据清洗不彻底有关。
他在测试R1模型时曾遇到类似问题,认为模型可能在RL+阶段将“极”字误学为终止符或语言切换标记。
他观察到模型在处理重复任务时会突然插入“极长”、“极大的数字”等词汇,随后终止输出。
根据其推测,SFT数据合成或预训练阶段可能未彻底清洗包含“极长”词汇的脏数据。
此外,模型在RAG检索增强生成过程中可能引入错误模式,导致正常输出被污染。
这一分析为理解DeepSeek V3.1模型的“极”字问题提供了可能的解释路径。
至于该问题何时能彻底解决,仍需等待DeepSeek官方发布新版本。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。