智谱发布GLM-5、DeepSeek推百万Token模型、MiniMax上线M2.5- DoNews

2月11日晚，智谱官方确认，此前在OpenRouter平台登顶热度榜首的匿名模型“Pony Alpha”即其新一代基座模型GLM-5，该模型已在chat.z.ai平台上线。该模型具备强编码能力、超长上下文窗口及对智能体工作流的深度优化，OpenRouter将其描述为“前沿基础模型”，在编程、智能体工作流、推理与角色扮演方面表现突出，尤其强调“极高的工具调用准确率”，支持通过Claude Code等工具实现数小时复杂项目开发。

智谱于1月8日在港交所挂牌上市，当日首席科学家唐杰在内部信中宣布GLM-5“即将发布”，并明确2026年起“全面回归基础模型研究”，同步设立前沿创新部门X-Lab，聚焦架构、学习范式与持续进化三大方向。

DeepSeek近期完成网页端与APP端版本更新，支持最高1M（百万）Token上下文长度，较2024年8月发布的DeepSeek V3.1（128K上下文）显著提升。目前全球支持百万级上下文的模型较少，仅谷歌Gemini系列与Anthropic Claude Opus 4.6等少数模型实现。DeepSeek V系列定位为追求极致综合性能的基础模型：2024年12月发布V3，采用高效MoE架构；此后迭代推出强化推理与Agent能力的V3.1，以及2025年12月发布的正式版V3.2；另设专注高难度数学与学术问题的特殊版本V3.2-Speciale。

据科技媒体The Information报道，DeepSeek计划于2026年2月中旬农历新年期间推出新一代旗舰模型DeepSeek V4，重点增强代码生成能力。今年初，DeepSeek团队发表两篇论文，公开mHC（流形约束超连接）与Engram（条件记忆模块）两项创新架构：前者优化深层Transformer信息流动，提升训练稳定性与可扩展性；后者将静态知识与动态计算解耦，利用廉价DRAM存储实体知识，释放高带宽内存（HBM）用于推理，显著降低长上下文推理成本。

同日，MiniMax宣布M2.5模型即将正式上线，目前已在其海外MiniMax Agent产品中开展内测。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。