2026年5月9日,稀宇科技(MiniMax)发布技术报告,宣布已修复M2系列大模型无法准确输出“马嘉祺”等人名的问题。问题源于分词器将“嘉祺”切为独立词元,但后训练数据中该词元样本极少,致其向量参数被高频词元挤压偏移。团队通过全词表合成数据开展“复读”训练,使词元生成稳定性显著提升,日语混入俄文字符率由47%降至1%。修复覆盖约20万个词元,其中4.9%存在类似退化现象。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。
2026年5月9日,稀宇科技(MiniMax)发布技术报告,宣布已修复M2系列大模型无法准确输出“马嘉祺”等人名的问题。问题源于分词器将“嘉祺”切为独立词元,但后训练数据中该词元样本极少,致其向量参数被高频词元挤压偏移。团队通过全词表合成数据开展“复读”训练,使词元生成稳定性显著提升,日语混入俄文字符率由47%降至1%。修复覆盖约20万个词元,其中4.9%存在类似退化现象。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。