2026年3月2日,阿里通义实验室语音团队发布两款支持FreeStyle自然语言指令的语音生成模型:Fun-CosyVoice3.5与Fun-AudioGen-VD。前者聚焦多语种语音复刻与精细化表达控制,新增泰语等4种语言支持,生僻字读错率由15.2%降至5.3%;后者专注声音设计与场景化音频生成,可联合建模音色、情绪、角色及环境音效。两款模型均面向开发者开放API调用,提升语音合成的可控性与沉浸感。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。
2026年3月2日,阿里通义实验室语音团队发布两款支持FreeStyle自然语言指令的语音生成模型:Fun-CosyVoice3.5与Fun-AudioGen-VD。前者聚焦多语种语音复刻与精细化表达控制,新增泰语等4种语言支持,生僻字读错率由15.2%降至5.3%;后者专注声音设计与场景化音频生成,可联合建模音色、情绪、角色及环境音效。两款模型均面向开发者开放API调用,提升语音合成的可控性与沉浸感。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。