DeepSeek V3.1出现“极”字bug，官方回应将修复- DoNews

近期，DeepSeek V3.1模型被开发者发现存在输出“极”字的bug，引发广泛关注。

多位开发者在调用API进行代码开发时，发现输出结果中频繁出现“极”字，影响正常使用。

问题最初在火山引擎、chutes等平台上被发现，随后扩展至腾讯的CodeBuddy，甚至DeepSeek官方。

国外Reddit平台也出现多个相关讨论，涉及“extreme”、“极”和“極”等关键词。

腾讯CodeBuddy甚至出现插入带“极”字广告的情况，进一步加剧问题严重性。

若开发者未及时发现该问题，直接使用生成的代码可能导致编译失败，影响高精度、结构化输出场景。

目前，问题已指向DeepSeek V3.1模型本身，官方回应称已与团队取得联系，将在近期版本中修复。

在问题完全解决前，已有网友提出应对方案，如小红书用户@大模型产品经理分享的提示词缓解方法。

该方法主要通过禁止特定符号序列模式，适用于调用API的第三方平台。

知乎用户黄哲威分析指出，该bug可能与数据清洗不彻底有关。

他在测试R1模型时曾遇到类似问题，认为模型可能在RL+阶段将“极”字误学为终止符或语言切换标记。

他观察到模型在处理重复任务时会突然插入“极长”、“极大的数字”等词汇，随后终止输出。

根据其推测，SFT数据合成或预训练阶段可能未彻底清洗包含“极长”词汇的脏数据。

此外，模型在RAG检索增强生成过程中可能引入错误模式，导致正常输出被污染。

这一分析为理解DeepSeek V3.1模型的“极”字问题提供了可能的解释路径。

至于该问题何时能彻底解决，仍需等待DeepSeek官方发布新版本。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。