1月26日,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking,创下科学知识、数学推理、代码编程等多项权威评测全球新纪录。该模型总参数量超万亿(1T),预训练数据量达36T Tokens,是目前阿里规模最大、能力最强的千问推理模型。
通过总参数规模、强化学习与推理计算的极致扩展,Qwen3-Max-Thinking实现性能大幅跃升。其采用新型测试时扩展(Test-time Scaling)机制,区别于传统并行路径冗余推理,可对前期推理结果进行经验提取与多轮自我迭代,在相同上下文中提升推理效率与智能水平。
在启用工具的‘人类最后的测试’(HLE)中,Qwen3-Max-Thinking得分为58.3,高于GPT-5.2-Thinking的45.5和Gemini 3 Pro的45.8,为当前所有模型最高分。
面向智能体(Agent)时代,该模型原生增强自主调用工具能力。经工具使用微调后,通义团队进一步开展基于规则奖励与模型奖励的联合强化学习训练,使模型能更智能地结合搜索、个性化记忆及代码解释器三大核心Agent工具功能,在QwenChat上实现专业级回答,同时显著降低幻觉。
开发者可通过QwenChat免费体验Qwen3-Max-Thinking;企业用户可通过阿里云百炼获取API服务;普通用户可通过千问PC端与网页端试用。千问App亦将接入该模型,向全体用户开放免费体验。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



