苹果公司与多国高校及研究院合作的最新研究揭示,大语言模型普遍存在"英语思维定式"现象。测试显示,即便专为中文优化的Qwen模型,其母语表达仍逊于人类水平,而Meta的Llama 3.1虽综合表现最佳,输出自然度仍有差距。
研究指出,模型在处理中文、法语等非英语内容时,常残留英语语法结构。为量化问题,团队提出"词汇自然性"和"句法自然性"两项指标,并通过"回译法"生成对比训练数据,显著提升了语言输出的本土化表达质量。中国学者在项目中发挥了重要作用。
苹果公司与多国高校及研究院合作的最新研究揭示,大语言模型普遍存在"英语思维定式"现象。测试显示,即便专为中文优化的Qwen模型,其母语表达仍逊于人类水平,而Meta的Llama 3.1虽综合表现最佳,输出自然度仍有差距。
研究指出,模型在处理中文、法语等非英语内容时,常残留英语语法结构。为量化问题,团队提出"词汇自然性"和"句法自然性"两项指标,并通过"回译法"生成对比训练数据,显著提升了语言输出的本土化表达质量。中国学者在项目中发挥了重要作用。