智谱发布开源语音合成系统GLM-TTS

2025年12月11日,智谱正式发布工业级语音合成系统GLM-TTS,并在Hugging Face、ModelScope等平台开放模型权重。该系统仅需3秒语音样本即可克隆音色,在字错误率和情感表达上达到开源SOTA水平。其采用两阶段生成架构与GRPO强化学习方案,仅用10万小时数据训练,预训练最快4天完成。GLM-TTS支持教育、电子书、客服等场景,已在智谱开放平台、智谱清言上线,提供API接口与在线体验入口。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1