2月11日晚,智谱官方确认,此前在OpenRouter平台登顶热度榜首的匿名模型“Pony Alpha”即其新一代基座模型GLM-5,该模型已在chat.z.ai平台上线。该模型具备强编码能力、超长上下文窗口及对智能体工作流的深度优化,OpenRouter将其描述为“前沿基础模型”,在编程、智能体工作流、推理与角色扮演方面表现突出,尤其强调“极高的工具调用准确率”,支持通过Claude Code等工具实现数小时复杂项目开发。
智谱于1月8日在港交所挂牌上市,当日首席科学家唐杰在内部信中宣布GLM-5“即将发布”,并明确2026年起“全面回归基础模型研究”,同步设立前沿创新部门X-Lab,聚焦架构、学习范式与持续进化三大方向。
DeepSeek近期完成网页端与APP端版本更新,支持最高1M(百万)Token上下文长度,较2024年8月发布的DeepSeek V3.1(128K上下文)显著提升。目前全球支持百万级上下文的模型较少,仅谷歌Gemini系列与Anthropic Claude Opus 4.6等少数模型实现。DeepSeek V系列定位为追求极致综合性能的基础模型:2024年12月发布V3,采用高效MoE架构;此后迭代推出强化推理与Agent能力的V3.1,以及2025年12月发布的正式版V3.2;另设专注高难度数学与学术问题的特殊版本V3.2-Speciale。
据科技媒体The Information报道,DeepSeek计划于2026年2月中旬农历新年期间推出新一代旗舰模型DeepSeek V4,重点增强代码生成能力。今年初,DeepSeek团队发表两篇论文,公开mHC(流形约束超连接)与Engram(条件记忆模块)两项创新架构:前者优化深层Transformer信息流动,提升训练稳定性与可扩展性;后者将静态知识与动态计算解耦,利用廉价DRAM存储实体知识,释放高带宽内存(HBM)用于推理,显著降低长上下文推理成本。
同日,MiniMax宣布M2.5模型即将正式上线,目前已在其海外MiniMax Agent产品中开展内测。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



