MiniMax押注新架构，推理模型迟到或影响估值与竞争力- DoNews

从AI六小龙缩减为AI四小强后，四家大模型创业公司相继上线自研推理模型。近期，MiniMax筹备半年多的文本推理模型即将发布，知情人士确认了这一消息。

曾几何时，MiniMax凭借MoE架构引领行业潮流。2023年下半年，大部分厂商仍聚焦稠密模型时，MiniMax创始人闫俊杰将资源投入MoE研发。2024年1月，abab6成为国内首个MoE大模型，推动MoE成为技术迭代方向。

然而，在新一轮推理模型浪潮中，MiniMax却成为后来者。尽管坚持不接入DeepSeek，但其在C端应用上的短板逐渐显现，腾讯等玩家通过接入DeepSeek吸引了更多用户关注。

缺失推理模型的影响正从多个方面左右着MiniMax的发展状态。外界对其高估值和后续融资是否可持续产生质疑。2024年3月，MiniMax完成6亿美元A轮融资，投后估值达25亿美元。据知情人士透露，当前估值已超40亿美元，但仍因缺乏推理模型被资本市场重新评估。

作为后来者，MiniMax不仅要推出推理模型，还需做到比现有竞品更优。前员工透露，去年中公司便启动推理模型研发，高级研究总监钟怡然曾表示有望于4月至5月间推出深度推理模型，但最终未能如期实现。

拖累推理模型更早上线的原因之一是闫俊杰对新架构的赌注。当其他公司着手研发推理模型时，MiniMax将重心放在Linear Attention架构创新上。2024年4月，MiniMax成为首批钻研该架构的公司，同年1月15日发布并开源MiniMax-01模型，首次尝试使用线性注意力机制处理全球最长上下文。

复杂的业务布局也分散了MiniMax的精力。公司在To C、To B、国内、海外均有广泛布局，导致产品与模型团队之间矛盾频发。2024年，MiniMax推出多款应用，但收入过亿和日活过千万的目标均未达成，引发人员变动和组织调整。

面对当下大模型赛道进入淘汰赛的局面，MiniMax寄希望于新的原生多模态推理模型重获市场关注。然而，字节、阿里、腾讯等巨头已在文本推理之外推出图像推理模型，更大的竞争来自DeepSeek R2和GPT-5。OpenAI确认正在开发GPT-5，预计年内上线；DeepSeek R2也有望在今年下半年推出。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。