三次“进窄门”,MiniMax走向AGI深处

模型就像一辆F1赛车,谁去开、怎么开,结果天差地别。真正决定胜负的,不是赛车本身,而是Harness。

文|关临长

“全球大模型牌桌上的席位正变得越来越少,再过一两年,能留在场上的公司可能不超过五家。”在2026腾讯云上海城市峰会上,MiniMax(稀宇科技)Agent首席架构师缪宇航抛出这一判断时,语气笃定:“MiniMax希望成为牌桌上的赢家,我们有信心。”

此时,距离MiniMax在港交所敲钟,仅仅过去三个月。它的成绩摆在眼前:刷新全球AI企业的最快上市纪录,上市首日股价暴涨109%,两个月市值一度突破3800亿港元。更耐人寻味的是,被誉为“龙虾之父”的Peter Steinberger在寻求开源模型替代方案时,连发五条推文公开称赞:MiniMax是最好的开源模型。

一个在巨头环伺下略显稚嫩的初上市公司,凭什么让全球顶流技术领袖如此不吝溢美之词?又凭什么敢在淘汰赛愈演愈烈的AI浪潮中,喊出“赢家”的野心?

01

押注全模态,赌AGI的未来

2021年,ChatGPT尚未问世,国内AI圈普遍遵循先聚焦单一垂直模型,再逐步拓展多模态能力的路径。在商业模式上也以“一客一模型”的定制化路线为主流,所谓的通用化,仅是将生产工具做成了通用外壳,边际成本居高不下。

在MiniMax创始人、CEO闫俊杰看来,沿着定制化的老路注定走进死胡同,只有让模型本身通用,定制成本才会归零,技术才能真正普惠。

2022年初,MiniMax成立的第一天,闫俊杰就定下了一个在当时看来颇为“激进”的战略:研发AGI(通用人工智能),专注于文本、视频、语音的全模态通用大模型研发。“AGI是能通过图灵测试的智能体,既能完成生产任务,也要提供娱乐体验,单一模态难以企及。”缪宇航解释。

这是少有人问津的“冷赛道”,一度被贴上“投入大、风险高、回报慢”的标签。全模态意味着指数级算力需求,一个理想的算力基础设施,不仅要能承载海量任务,还要足够高性价比,一小时异常,在千卡规模下可产生数以十万计的成本开销。如果不能解决效率问题,再好的愿景也会“死”在起跑线上。

“MiniMax成立的Day1就有腾讯云为我们提供支持,而且没有因为我们是小公司而怠慢。”缪宇航介绍,从最初的训练算力集群搭建,到后来的海量数据处理,腾讯云提供了从GPU算力、网络架构到存储资源的全栈支撑。如HCC高性能计算集群将上架到训练时间压缩至1天,IHN智能高性能网络将通信损耗压至6%,GPU利用率提升40%,研发成本削减30%。

得益于底层基建的稳固,MiniMax将更多精力聚焦在模型本身的训练和工程化上。2025年5月,Speech 02模型综合性能跃居全球第一,6月推出的Hailuo 02视频模型,位列AA视频竞技场全球第二。10月,MiniMax发布开源文本大模型M2跻身Artificial Analysis开源第一。

“MiniMax是全球唯一一家在多个模态上都全力投入,且拿到全球领先的创业公司,目前可能只有OpenAI、Google这样的全球巨头能做到。”缪宇航底气十足。

02

抢抓Agent拐点:卷Token,更卷Harness

2026年初“龙虾”的爆火,让AI产业迎来拐点——人工智能的应用范式从Chatbot向AI Agent跃迁。当AI开始像人一样自主执行任务,比拼的就不再只是模型参数和跑分榜单。

当行业还在沉迷于这些旧指标时,MiniMax更早看到了更深层的真相:主流大模型的能力差距正在缩小,竞争焦点会从卷参数转向卷“同等Token能产出多少价值”。这才是Agent时代的真正赛场。

什么决定了Token的价值产出?缪宇航用一个比喻点破了关键:“模型就像一辆F1赛车,谁去开、怎么开,结果天差地别。真正决定胜负的,不是赛车本身,而是Harness。”

因为Agent时代改变了Token的消耗方式,同样的模型能力,不同的Harness设计,会让完成同一任务的Token消耗相差数倍。所以,卷Token,本质上拼的是Harness,拼的是迭代的速度。

让Harness“快”起来的,正是沙箱。MiniMax迭代模型的速度取决于Agentic RL训练,需要瞬时启动上万个环境,传统K8S无法满足“毫秒级拉起”。但和腾讯云一同打造的百万级吞吐、十万级并发的Agent训练沙箱,1分钟内能拉起超十万个容器沙箱,百毫秒级启动速度,用完即销毁,大幅提升了训练效率。“这是国内最大的训练沙箱系统之一,支撑MiniMax模型一月一次迭代,性能迅速提升。”缪宇航说。

与此同时,Agent自主执行带来的安全困境,也被腾讯云的全栈安全防护一一化解,帮助MiniMax满足客户的安全、内容合规需求,抵御外部威胁,让大模型推理应用更加可靠。

这套围绕Agent重构的Harness工程,让MiniMax的极致性价比得以落地。春节期间其发布的M2.5模型成本打到1美元/小时,1万美元可让4个Agent不间断工作一整年。

以Agent为中心的工程思维,也让MiniMax向AI-Native组织一样不断自我进化。目前内部Agent实习生覆盖近90%员工,实验室里50%-70%的强化学习工作由Agent自主完成。

03

Token即电力:中国算力的隐形出海

2026年3月,国家数据局局长刘烈宏披露了一组数据:中国日均Token调用量已突破140万亿,较2024年初增长超1000倍。爆发式增长的数字标志着“Token经济”已经到来。

而这正是MiniMax早在四年前就预判到的图景——Token应像电力一样成为一种标准化的、可全球流通的“能源单位”。

基于这一超前认知,MiniMax在成立之初就确立了“立足中国、面向全球”的定位,通过Talkie AI、海螺AI等产品矩阵在海外市场扎根,B端上给全球超过100多个国家的企业客户和开发者,提供API服务。目前,其年收入超过73%来自海外,服务全球超2.36亿个人用户和20多万企业客户与开发者。

如今,当国内同行陷入“卷Token价格”的泥潭时,MiniMax早早跳出了这个战场。据招股书显示,MiniMax仅投入约4.49亿美元(2022年至2025年9月)的模型训练及云服务成本,就跻身全球顶级AI公司之列。这种成本优势直接转化为产品定价的竞争力。例如,其API定价仅为海外领先模型的约8%,这导致To-B API业务保持超60%的毛利率。

当然,服务全球市场并非坦途,腾讯云覆盖全球的计算节点和CDN加速,帮助MiniMax在不同国家和地区顺利扎根,保证了全球范围内的稳定、高效运行。

积累了服务全球用户的经验和能力,让MiniMax对自身定位有了更清晰的认知。在上市后的首个业绩电话会上,闫俊杰宣布战略升级:从大模型公司转向“AI时代的平台型公司”。在他看来平台型是指那些是能够定义智能边界,同时在产品与商业层面兑现行业红利的企业。

回看MiniMax的成长路,敢于押注通用模型,敢于深耕Harness工程,敢于率先出海拓展增长空间——每一步都进窄门,踩在主流认知的对立面。但正是这些“反共识”的选择,让一家小公司从牌桌边缘走到了牌桌中央,并萌生了赢下整场游戏的渴望。

“大模型行业的竞争向来你追我赶、互有胜负,没有任何一家企业能保证永远处于技术领先地位,但我们有信心,在未来的关键战役中持续取胜。”闫俊杰说。

特别声明:本文为合作媒体授权DoNews专栏转载,文章版权归原作者及原出处所有。文章系作者个人观点,不代表DoNews专栏的立场,转载请联系原作者及原出处获取授权。(有任何疑问都请联系idonews@donews.com)

标签: 科技
三次“进窄门”,MiniMax走向AGI深处
扫描二维码查看原文
分享自DoNews
Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1