智谱发布GLM-5.2开源模型,1M无损上下文登顶全球可用编程模型榜首

智谱宣布GLM-5.2模型正式上线并开源。该模型在大模型盲测平台竞技场Code Arena中取得1595分,位列总榜第二、全球可用模型第一;在Design Arena中以1360分位居全球第一。

GLM-5.2支持100万Token无损上下文,可稳定处理数百万字长文本、数百页复杂PDF或中大型软件项目完整代码库,有效解决长文本理解能力断崖式下降问题。技术团队通过扩展Coding Agent训练环境,在FrontierSWE测试中仅比Claude Opus 4.8低1%,高于GPT-5.5和Opus 4.7各1%与11%。实际测试中一次性完成Web、移动端与小程序全栈应用开发,累计处理88万Token。

行业正从关注回答质量转向评估长程任务执行能力。GLM-5.2被定位为专为长时程任务设计的基座模型,支持需求一句话输入后自主完成开发、联调、测试至打包上线全流程,数小时内交付跨平台可用应用。官方强调其目标是支撑跨越数周至数月的规划与执行,减少因上下文限制导致的信息损耗与任务偏移。

在Terminal-Bench 2.1中得分为81.0,较前代GLM-5.1提升17.5个百分点;SWE-bench Pro得分为62.1;Artificial Analysis综合榜单得分为51分,位列开源模型SOTA。该榜单显示智谱已与Anthropic、OpenAI构成新‘御三家’,超越谷歌Gemini。

部分开发者反馈GLM-5.2存在自主性不足、运行拥堵及额度消耗快等问题,但整体性能获广泛认可。有开发者表示其编程能力已达到难以与Claude Opus区分的水平。

模型以MIT协议开源,已上线Hugging Face与ModelScope,允许自由下载、部署与商用。Day 0即完成华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞等全部主流国产算力平台推理适配,支持完全国产化集群部署。下半年昇腾950超节点亦将纳入支持体系。Infra优化使1M上下文下单位Token FLOPs降至2.9倍。

GLM-5.2发布时间紧邻Anthropic因美国出口管制暂停Claude Fable 5与Mythos 5全球服务之后。智谱声明称:‘前沿智能不应只属于少数人,也不应被少数规则随时收回。它应该开放、可用、可构建,并服务于每一位开发者。’

智谱下一步将聚焦完全自治的智能体系统(Autonomous Agent System),推动实现7×24小时运转的智能体群体。其创始人唐杰指出,该方向将加速行业从‘一人公司’向‘无员工公司’演进,并需持续攻克记忆机制、持续学习与自我评判等核心技术。GLM-5.2被视为中国AI首次站上通往AGI终局最前排的关键节点。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2026 All Rights Reserved
京ICP备2025120072号