阿里通义千问开源 Qwen2-Audio 7B 语音交互大模型：自由互动，无需输入文本- DoNews

DoNews > 公司新闻 > 阿里通义千问开源 Qwen2-Audio 7B 语音交互大模型：自由互动，无需输入文本

阿里通义千问开源 Qwen2-Audio 7B 语音交互大模型：自由互动，无需输入文本

IT之家 2024-08-13 12:07:20

阿里通义千问开源 Qwen2-Audio 系列的两个模型 Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。

作为一个大规模音频语言模型，Qwen2-Audio 能够接受各种音频信号输入，并根据语音指令执行音频分析或直接响应文本，有两种不同的音频交互模式：

语音聊天：用户可以自由地与 Qwen2-Audio 进行语音互动，而无需文本输入
音频分析：用户可以在互动过程中提供音频和文本指令对音频进行分析

官方在一系列基准数据集上进行了测试，Qwen2-Audio 超越了先前的最佳模型。

▲ Qwen2-Audio 整体表现

IT之家附相关链接如下：

试用链接：https://huggingface.co/spaces/Qwen/Qwen2-Audio-Instruct-Demo
论文地址：https://arxiv.org/abs/2407.10759
评估标准：https://github.com/OFA-Sys/AIR-Bench
开源代码：https://github.com/QwenLM/Qwen2-Audio

本文转载自IT之家，转载目的在于传递更多信息，并不代表本站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请联系IT之家通知我方删除，我方将在收到通知后第一时间删除内容！本文只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权。

千里科技：2025年实现营业收入99.99亿元，同比增长42.13% 千里科技2023年营收99.99亿元、净利8441万元，均大幅增长；智能驾驶、座舱及Robotaxi取得突破，研发投入同比增102.13%。

苏泊尔2025年归母净利约19.14亿元，同比下降7.28% 苏泊尔2025年营收227.72亿元（+1.54%），净利20.97亿元（-6.58%），系2021年来首次下滑，主因外销受关税等地缘政治影响及销售费

嘀嗒出行年营收5亿：同比降36% 经调整净利1.4亿降34.6% 嘀嗒出行2025年营收5.02亿元，同比降36.2%；毛利3.33亿元，降41.3%；经调整净利1.38亿元，降34.6%；现金9.67亿元，股价1.29港元。

原小米硬件高管徐睿将成为Meta新组建AI硬件团队负责人徐睿加盟Meta，将领导MSL新成立的AI硬件团队。他历任小米、字节跳动等多家科技公司硬件高管，近期随Dreamer被Meta收购加入。

北汽集团 3 月销量超 18.2 万辆，同比增长 7% 北汽集团3月销量18.2万辆，同比增7%；自主品牌、海外销量分别增19%、47%；极狐、北京越野Q1交付同比增34%、67%。

米哈游创始人向交大捐赠，捐资助力“AI未来基石”基金米哈游联合创始人刘伟代表创始团队向上海交大捐设“AI未来基石”基金，支持AI前沿研究与人才培养，致敬母校130周年。

小鹏回应澳大利亚独家经销商合作破裂小鹏终止澳洲代理TrueEV独家资格，因对方资金断裂、违约订单及信任破裂；法院驳回其禁令申请；小鹏加速构建本地化服务网络，打造可信赖科技品牌。

单依纯，可惜了一个年少成名的歌手的分裂。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号