阿里云今日正式推出通义千问系列迄今规模最大、能力最强的语言模型Qwen3-Max。该模型总参数量突破1T,预训练数据达36T tokens,在知识推理、代码生成、智能体任务等多项基准测试中表现领先。
Qwen3-Max-Instruct正式版在代码能力与智能体性能上进一步提升,于SWE-Bench Verified测试中获得69.6分,在Tau2-Bench工具调用测试中以74.8分超越Claude Opus 4等国际顶尖模型。其推理增强版本Qwen3-Max-Thinking在AIME 25、HMMT等高难度数学推理测试中实现100%准确率,预计将于近期向公众开放。
得益于MoE架构与PAI-FlashMoE并行优化技术,模型训练稳定性与效率显著提升,长序列训练吞吐量达到序列并行方案的3倍,并支持1M上下文长度。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。