通义开源两款“百聆”语音模型

2025年12月15日,通义大模型宣布开源两款“百聆”语音模型,并完成关键升级。Fun-CosyVoice3-0.5B支持zero-shot音色克隆,仅需3秒录音即可实现跨语种、方言及情感的语音合成,首包延迟降低50%,中英混说准确率显著提升。同期开源的轻量级Fun-ASR-Nano-0.8B,支持31语种混说与方言识别,流式识别首字延迟低至160ms,适用于多场景本地部署。两款模型均已开放下载与体验入口。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1