通义团队发布7款AI产品 全面升级多模态能力

通义团队在云栖大会集中发布6大模型及企业级语音品牌“通义百聆”,全面升级AI技术矩阵。

Qwen MAX为万亿参数大模型,代码生成效率较上一代提升40%,数学推理正确率达91.2%;全模态模型Qwen3-Omni支持108种语言输入输出,可处理12小时长音频并生成精准会议纪要,已嵌入智能设备实现“语音指令-设备联动”复合操作。视觉模型Qwen3-VL具备长视频内容定位能力,可识别23种语言文字并支持2万字超长文本处理;Qwen-Image升级后实现人脸、商品等关键元素的编辑保真,支持多图批量处理。代码模型Qwen3-Coder可处理10万行级项目代码,漏洞修复准确率提升至89%;Wan2.5-Preview则实现音画同步视频生成,支持科学图表与多语言图文混排。

“通义百聆”语音基座大模型通过定制化训练解决行业语音识别中的“幻觉输出”问题,支持跨语种语音克隆,已服务金融、医疗等8大行业。目前所有模型均在魔搭、GitHub开源并支持阿里云百炼平台API调用,推动AI技术规模化落地。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1