阿里云通义团队发布新一代基础模型架构Qwen3-Next，并开源基于该架构的80B参数模型。新架构融合混合注意力机制、高稀疏度MoE结构与多token预测机制，显著提升长上下文和大规模参数下的训练与推理效率。- DoNews快讯

DoNews > 快讯 > 阿里云通义团队发布新一代基础模型架构Qwen3-Next，并开源基于该架构的80B参数模型。新架构融合混合注意力机制、高稀疏度MoE结构与多token预测机制，显著提升长上下文和大规模参数下的训练与推理效率。

阿里云通义团队发布新一代基础模型架构Qwen3-Next，并开源基于该架构的80B参数模型。新架构融合混合注意力机制、高稀疏度MoE结构与多token预测机制，显著提升长上下文和大规模参数下的训练与推理效率。

2025-09-12 06:55:03

430848

Qwen3-Next-80B模型以仅激活30亿参数实现接近32B密集模型的性能，训练成本降低至十分之一以下，长上下文推理吞吐提升超十倍。该模型原生支持262K上下文，可扩展至约百万tokens，部分评测表现接近或超越业界先进模型。

模型已通过Hugging Face开源，支持多种框架部署。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

康宁杰瑞发布年度业绩，年内亏损人民币1.14亿元同比盈转亏康宁杰瑞2025年营收5.66亿元同比降11.54%，研发开支5.72亿元增41.57%，年内亏损1.14亿元，现金储备13.5亿元。

消息称 xAI 创始团队仅剩一人，马斯克将亲自接管 xAI联合创始人马努埃尔·克罗伊斯离职，11人团队仅剩1人；马斯克重组架构、调援特斯拉/SpaceX人员，并推进与SpaceX合并以提升估值。

古偶编剧“厕点”频出，谁在背锅谁在隐身？话语权为0的古偶编剧，是最大“背锅侠”吗？

大麦娱乐MSCI ESG评级跃升至AAA级，为全球媒体娱乐行业最高评级连续四年评级跃升

苹果回应少数 iPhone 意外呼出电话情况，iOS 26.3 已修复苹果承认iOS 26双SIM机型存在意外呼出电话缺陷，系未选SIM卡且设备闲置所致，已在iOS 26.3修复，建议用户升级。

亚盛医药-B双引擎驱动高增长，耐立克销售同比大增81% 亚盛医药2025年营收5.74亿元，耐立克销售额4.35亿元（+81%），利生妥上市5个月售7058万元；两大产品驱动增长，多项III期临床获美欧监管许可。

菜鸟计划在欧洲开设多个专业品类仓，德国电池专仓已投入运营菜鸟在德国曼海姆启用欧洲首个电池专用仓，满足中国储能电池等‘新三样’出海的合规仓储与全链路物流需求。

腾势汽车领航博鳌亚洲论坛2026年年会以科技豪华赋能国际盛事腾势汽车领航博鳌亚洲论坛2026年年会以科技豪华赋能国际盛事

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号