阿里巴巴集团旗下的通义实验室正式开源新一代语音识别系列模型Qwen3。该模型支持多语种语音转文本任务,涵盖中文、英文及多种小语种,具备流式与非流式两种识别模式,适用于实时语音交互与长音频离线转写场景。Qwen3采用改进的编码器-解码器架构,在公开基准测试中相较前代Qwen2在中文普通话ASR任务上词错误率降低约18%。模型权重、训练代码及推理工具已通过Hugging Face和GitHub平台向全球开发者免费开放。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。
阿里巴巴集团旗下的通义实验室正式开源新一代语音识别系列模型Qwen3。该模型支持多语种语音转文本任务,涵盖中文、英文及多种小语种,具备流式与非流式两种识别模式,适用于实时语音交互与长音频离线转写场景。Qwen3采用改进的编码器-解码器架构,在公开基准测试中相较前代Qwen2在中文普通话ASR任务上词错误率降低约18%。模型权重、训练代码及推理工具已通过Hugging Face和GitHub平台向全球开发者免费开放。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。