DeepSeek V3.1出现“极”字bug,官方回应将修复

近期,DeepSeek V3.1模型被开发者发现存在输出“极”字的bug,引发广泛关注。

多位开发者在调用API进行代码开发时,发现输出结果中频繁出现“极”字,影响正常使用。

问题最初在火山引擎、chutes等平台上被发现,随后扩展至腾讯的CodeBuddy,甚至DeepSeek官方。

国外Reddit平台也出现多个相关讨论,涉及“extreme”、“极”和“極”等关键词。

腾讯CodeBuddy甚至出现插入带“极”字广告的情况,进一步加剧问题严重性。

若开发者未及时发现该问题,直接使用生成的代码可能导致编译失败,影响高精度、结构化输出场景。

目前,问题已指向DeepSeek V3.1模型本身,官方回应称已与团队取得联系,将在近期版本中修复。

在问题完全解决前,已有网友提出应对方案,如小红书用户@大模型产品经理分享的提示词缓解方法。

该方法主要通过禁止特定符号序列模式,适用于调用API的第三方平台。

知乎用户黄哲威分析指出,该bug可能与数据清洗不彻底有关。

他在测试R1模型时曾遇到类似问题,认为模型可能在RL+阶段将“极”字误学为终止符或语言切换标记。

他观察到模型在处理重复任务时会突然插入“极长”、“极大的数字”等词汇,随后终止输出。

根据其推测,SFT数据合成或预训练阶段可能未彻底清洗包含“极长”词汇的脏数据。

此外,模型在RAG检索增强生成过程中可能引入错误模式,导致正常输出被污染。

这一分析为理解DeepSeek V3.1模型的“极”字问题提供了可能的解释路径。

至于该问题何时能彻底解决,仍需等待DeepSeek官方发布新版本。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1