三次“进窄门”，MiniMax走向AGI深处- DoNews专栏

模型就像一辆F1赛车，谁去开、怎么开，结果天差地别。真正决定胜负的，不是赛车本身，而是Harness。

文｜关临长

“全球大模型牌桌上的席位正变得越来越少，再过一两年，能留在场上的公司可能不超过五家。”在2026腾讯云上海城市峰会上，MiniMax（稀宇科技）Agent首席架构师缪宇航抛出这一判断时，语气笃定：“MiniMax希望成为牌桌上的赢家，我们有信心。”

此时，距离MiniMax在港交所敲钟，仅仅过去三个月。它的成绩摆在眼前：刷新全球AI企业的最快上市纪录，上市首日股价暴涨109%，两个月市值一度突破3800亿港元。更耐人寻味的是，被誉为“龙虾之父”的Peter Steinberger在寻求开源模型替代方案时，连发五条推文公开称赞：MiniMax是最好的开源模型。

一个在巨头环伺下略显稚嫩的初上市公司，凭什么让全球顶流技术领袖如此不吝溢美之词？又凭什么敢在淘汰赛愈演愈烈的AI浪潮中，喊出“赢家”的野心？

押注全模态，赌AGI的未来

2021年，ChatGPT尚未问世，国内AI圈普遍遵循先聚焦单一垂直模型，再逐步拓展多模态能力的路径。在商业模式上也以“一客一模型”的定制化路线为主流，所谓的通用化，仅是将生产工具做成了通用外壳，边际成本居高不下。

在MiniMax创始人、CEO闫俊杰看来，沿着定制化的老路注定走进死胡同，只有让模型本身通用，定制成本才会归零，技术才能真正普惠。

2022年初，MiniMax成立的第一天，闫俊杰就定下了一个在当时看来颇为“激进”的战略：研发AGI（通用人工智能），专注于文本、视频、语音的全模态通用大模型研发。“AGI是能通过图灵测试的智能体，既能完成生产任务，也要提供娱乐体验，单一模态难以企及。”缪宇航解释。

这是少有人问津的“冷赛道”，一度被贴上“投入大、风险高、回报慢”的标签。全模态意味着指数级算力需求，一个理想的算力基础设施，不仅要能承载海量任务，还要足够高性价比，一小时异常，在千卡规模下可产生数以十万计的成本开销。如果不能解决效率问题，再好的愿景也会“死”在起跑线上。

“MiniMax成立的Day1就有腾讯云为我们提供支持，而且没有因为我们是小公司而怠慢。”缪宇航介绍，从最初的训练算力集群搭建，到后来的海量数据处理，腾讯云提供了从GPU算力、网络架构到存储资源的全栈支撑。如HCC高性能计算集群将上架到训练时间压缩至1天，IHN智能高性能网络将通信损耗压至6%，GPU利用率提升40%，研发成本削减30%。

得益于底层基建的稳固，MiniMax将更多精力聚焦在模型本身的训练和工程化上。2025年5月，Speech 02模型综合性能跃居全球第一，6月推出的Hailuo 02视频模型，位列AA视频竞技场全球第二。10月，MiniMax发布开源文本大模型M2跻身Artificial Analysis开源第一。

“MiniMax是全球唯一一家在多个模态上都全力投入，且拿到全球领先的创业公司，目前可能只有OpenAI、Google这样的全球巨头能做到。”缪宇航底气十足。

抢抓Agent拐点：卷Token，更卷Harness

2026年初“龙虾”的爆火，让AI产业迎来拐点——人工智能的应用范式从Chatbot向AI Agent跃迁。当AI开始像人一样自主执行任务，比拼的就不再只是模型参数和跑分榜单。

当行业还在沉迷于这些旧指标时，MiniMax更早看到了更深层的真相：主流大模型的能力差距正在缩小，竞争焦点会从卷参数转向卷“同等Token能产出多少价值”。这才是Agent时代的真正赛场。

什么决定了Token的价值产出？缪宇航用一个比喻点破了关键：“模型就像一辆F1赛车，谁去开、怎么开，结果天差地别。真正决定胜负的，不是赛车本身，而是Harness。”

因为Agent时代改变了Token的消耗方式，同样的模型能力，不同的Harness设计，会让完成同一任务的Token消耗相差数倍。所以，卷Token，本质上拼的是Harness，拼的是迭代的速度。

让Harness“快”起来的，正是沙箱。MiniMax迭代模型的速度取决于Agentic RL训练，需要瞬时启动上万个环境，传统K8S无法满足“毫秒级拉起”。但和腾讯云一同打造的百万级吞吐、十万级并发的Agent训练沙箱，1分钟内能拉起超十万个容器沙箱，百毫秒级启动速度，用完即销毁，大幅提升了训练效率。“这是国内最大的训练沙箱系统之一，支撑MiniMax模型一月一次迭代，性能迅速提升。”缪宇航说。

与此同时，Agent自主执行带来的安全困境，也被腾讯云的全栈安全防护一一化解，帮助MiniMax满足客户的安全、内容合规需求，抵御外部威胁，让大模型推理应用更加可靠。

这套围绕Agent重构的Harness工程，让MiniMax的极致性价比得以落地。春节期间其发布的M2.5模型成本打到1美元/小时，1万美元可让4个Agent不间断工作一整年。

以Agent为中心的工程思维，也让MiniMax向AI-Native组织一样不断自我进化。目前内部Agent实习生覆盖近90%员工，实验室里50%-70%的强化学习工作由Agent自主完成。

Token即电力：中国算力的隐形出海

2026年3月，国家数据局局长刘烈宏披露了一组数据：中国日均Token调用量已突破140万亿，较2024年初增长超1000倍。爆发式增长的数字标志着“Token经济”已经到来。

而这正是MiniMax早在四年前就预判到的图景——Token应像电力一样成为一种标准化的、可全球流通的“能源单位”。

基于这一超前认知，MiniMax在成立之初就确立了“立足中国、面向全球”的定位，通过Talkie AI、海螺AI等产品矩阵在海外市场扎根，B端上给全球超过100多个国家的企业客户和开发者，提供API服务。目前，其年收入超过73%来自海外，服务全球超2.36亿个人用户和20多万企业客户与开发者。

如今，当国内同行陷入“卷Token价格”的泥潭时，MiniMax早早跳出了这个战场。据招股书显示，MiniMax仅投入约4.49亿美元（2022年至2025年9月）的模型训练及云服务成本，就跻身全球顶级AI公司之列。这种成本优势直接转化为产品定价的竞争力。例如，其API定价仅为海外领先模型的约8%，这导致To-B API业务保持超60%的毛利率。

当然，服务全球市场并非坦途，腾讯云覆盖全球的计算节点和CDN加速，帮助MiniMax在不同国家和地区顺利扎根，保证了全球范围内的稳定、高效运行。

积累了服务全球用户的经验和能力，让MiniMax对自身定位有了更清晰的认知。在上市后的首个业绩电话会上，闫俊杰宣布战略升级：从大模型公司转向“AI时代的平台型公司”。在他看来平台型是指那些是能够定义智能边界，同时在产品与商业层面兑现行业红利的企业。

回看MiniMax的成长路，敢于押注通用模型，敢于深耕Harness工程，敢于率先出海拓展增长空间——每一步都进窄门，踩在主流认知的对立面。但正是这些“反共识”的选择，让一家小公司从牌桌边缘走到了牌桌中央，并萌生了赢下整场游戏的渴望。

“大模型行业的竞争向来你追我赶、互有胜负，没有任何一家企业能保证永远处于技术领先地位，但我们有信心，在未来的关键战役中持续取胜。”闫俊杰说。

特别声明：本文为合作媒体授权DoNews专栏转载，文章版权归原作者及原出处所有。文章系作者个人观点，不代表DoNews专栏的立场，转载请联系原作者及原出处获取授权。(有任何疑问都请联系idonews@donews.com)