火山引擎发布豆包语音识别模型2.0

今日,火山引擎发布豆包语音识别模型2.0(Doubao-Seed-ASR-2.0),基于Seed混合专家大语言模型架构,在20亿参数音频编码器基础上升级。模型通过强化学习提升上下文推理能力,关键词召回率提高20%,可精准识别专有名词、多音字及易混淆词汇。新增多模态视觉识别功能,支持结合单图或多图内容进行语音解析,有效区分“滑鸡”与“滑稽”等语义偏差。同时支持中、英及日、韩、德、法等13种海外语种识别。该模型已上线火山方舟体验中心,开放API服务。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1