阿里开源Qwen3-Next架构训练成本降低超九成- DoNews

DoNews > 公司新闻 > 阿里开源Qwen3-Next架构训练成本降低超九成

阿里开源Qwen3-Next架构训练成本降低超九成

推荐 2025-09-12 17:53:03

阿里通义发布下一代基础模型架构Qwen3-Next和基于新架构的模型Qwen3-Next-80B-A3B，包含指令模型和推理模型。

新架构相比Qwen3的MoE结构，引入混合注意力机制、高稀疏度MoE结构、训练稳定优化机制以及多token预测机制。

新模型采用全球首创混合架构，75%采用线性注意力机制，25%采用原创门控注意力机制，总参数80B只需激活3B即可媲美Qwen3旗舰版235B模型。

Qwen3-Next模型训练成本较密集模型Qwen3-32B大降超90%，长文本推理吞吐量提升10倍以上，预训练仅需15T tokens。

Qwen3-Next通过更精密的高稀疏MoE架构设计，实现1比50的激活比，创下业界新高。

新模型指令模型性能表现与Qwen3-235B-A22B-Instruct-2507持平，推理模型表现优于Gemini-2.5-Flash-Thinking。

新模型已在魔搭社区和HuggingFace开源，开发者可通过Qwen Chat免费体验或调用阿里云百炼平台API服务。

Pine AI联合创始人李博杰表示，Qwen3-Next采用混合注意力机制和高稀疏MoE架构，大幅提升效率。

李博杰指出，Qwen3-Next在预训练时采用多Token预测技术MTP，模型推理速度大幅提升，并达到谷歌Gemini 2.5 flash水平。

阿里通义近期推出Qwen3-Max-Preview、Qwen-Image-edit、Qwen3-ASR-Flash等模型，衍生模型数已超17万。

沙利文数据显示，中国企业级大模型调用量2025年上半年日均较2024年底增长363%，阿里通义占比17.7%位列第一。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

西贝门店负责人：羊肉每年一次集采冷冻发往全国西贝餐饮负责人回应肉制品问题，称使用去年库存肉做员工餐，强调冷冻羊肉与新鲜肉无异。

西贝创始人贾国龙道歉：应对方式有错，以后向胖东来学习西贝创始人贾国龙称将改正错误，学习胖东来，打造透明企业。

西贝十年给咨询公司华与华支付了6000万元咨询费罗永浩与西贝因预制菜争议引发热议，华杉为西贝辩护并遭罗转发批评，涉及华与华公司品牌战略服务及‘超级符号’理论。

海菲曼亮相第七届北京国际耳机展海菲曼携多款高端耳机亮相第七届北京国际耳机展，展示自研增强磁体、超纳米振膜等技术，推动中国声学走向全球。

西贝回应员工用漏勺疏通下水道西贝后厨被曝用漏勺捞下水道残渣，引发食品安全担忧，公司称已关注并核查。

都说iPhone 17“又丑又土”，怎么你还是抢不到？一场“口嫌体正直”的消费狂欢

宝骏公布OTA升级计划，将于年底行业首发10万级城市领航辅助宝骏汽车携手龚俊发布云海2026款及俊雅版，并公布分阶段OTA升级计划，涵盖座舱交互与城市领航辅助功能，提升用户体验。

滴滴2024年所有订单平均抽成14%；2025年大盘票房(含预售)突破400亿；宗馥莉或另立门户启用新品牌“娃小宗”｜Do早报今日早报已为你呈上～

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号