2025年12月15日,通义大模型宣布开源两款“百聆”语音模型,并完成关键升级。Fun-CosyVoice3-0.5B支持zero-shot音色克隆,仅需3秒录音即可实现跨语种、方言及情感的语音合成,首包延迟降低50%,中英混说准确率显著提升。同期开源的轻量级Fun-ASR-Nano-0.8B,支持31语种混说与方言识别,流式识别首字延迟低至160ms,适用于多场景本地部署。两款模型均已开放下载与体验入口。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。
2025年12月15日,通义大模型宣布开源两款“百聆”语音模型,并完成关键升级。Fun-CosyVoice3-0.5B支持zero-shot音色克隆,仅需3秒录音即可实现跨语种、方言及情感的语音合成,首包延迟降低50%,中英混说准确率显著提升。同期开源的轻量级Fun-ASR-Nano-0.8B,支持31语种混说与方言识别,流式识别首字延迟低至160ms,适用于多场景本地部署。两款模型均已开放下载与体验入口。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。