阿里云今日推出旗舰模型Qwen3-235B-A22B-Instruct-2507-FP8,这是其Qwen3系列的更新版本,采用非思考模式(Non-thinking),并终止了此前混合思考模式的训练策略。据官方介绍,新模型在指令遵循、逻辑推理、多语言知识覆盖等通用能力上显著提升,于GQPA、AIME25等权威测评中表现优异,超越Kimi-K2、DeepSeek-V3等开源模型及Claude-Opus4-Non-thinking等闭源产品。
该模型参数量达235B,支持262,144上下文长度,并优化了长尾知识覆盖与用户偏好契合度。目前已在魔搭社区和HuggingFace开源。