阿里通义千问今日推出全新推理模型Qwen3-30B-A3B-Thinking-2507,在推理能力、通用性能及上下文长度上实现显著提升。新模型在AIME25数学评测中取得85.0分,代码能力测试LiveCodeBench v6得分66.0,均超越Gemini2.5-Flash等竞品。此外,其知识水平(GPQA、MMLU-Pro)及写作、Agent能力等通用评测表现也优于前代模型。
新模型原生支持256K tokens上下文,可扩展至1M tokens,并优化了思考长度,适合复杂推理任务。目前,该模型已在魔搭社区、HuggingFace开源,并上线Qwen Chat,支持消费级硬件本地部署。