MiniMax押注新架构,推理模型迟到或影响估值与竞争力

从AI六小龙缩减为AI四小强后,四家大模型创业公司相继上线自研推理模型。近期,MiniMax筹备半年多的文本推理模型即将发布,知情人士确认了这一消息。

曾几何时,MiniMax凭借MoE架构引领行业潮流。2023年下半年,大部分厂商仍聚焦稠密模型时,MiniMax创始人闫俊杰将资源投入MoE研发。2024年1月,abab6成为国内首个MoE大模型,推动MoE成为技术迭代方向。

然而,在新一轮推理模型浪潮中,MiniMax却成为后来者。尽管坚持不接入DeepSeek,但其在C端应用上的短板逐渐显现,腾讯等玩家通过接入DeepSeek吸引了更多用户关注。

缺失推理模型的影响正从多个方面左右着MiniMax的发展状态。外界对其高估值和后续融资是否可持续产生质疑。2024年3月,MiniMax完成6亿美元A轮融资,投后估值达25亿美元。据知情人士透露,当前估值已超40亿美元,但仍因缺乏推理模型被资本市场重新评估。

作为后来者,MiniMax不仅要推出推理模型,还需做到比现有竞品更优。前员工透露,去年中公司便启动推理模型研发,高级研究总监钟怡然曾表示有望于4月至5月间推出深度推理模型,但最终未能如期实现。

拖累推理模型更早上线的原因之一是闫俊杰对新架构的赌注。当其他公司着手研发推理模型时,MiniMax将重心放在Linear Attention架构创新上。2024年4月,MiniMax成为首批钻研该架构的公司,同年1月15日发布并开源MiniMax-01模型,首次尝试使用线性注意力机制处理全球最长上下文。

复杂的业务布局也分散了MiniMax的精力。公司在To C、To B、国内、海外均有广泛布局,导致产品与模型团队之间矛盾频发。2024年,MiniMax推出多款应用,但收入过亿和日活过千万的目标均未达成,引发人员变动和组织调整。

面对当下大模型赛道进入淘汰赛的局面,MiniMax寄希望于新的原生多模态推理模型重获市场关注。然而,字节、阿里、腾讯等巨头已在文本推理之外推出图像推理模型,更大的竞争来自DeepSeek R2和GPT-5。OpenAI确认正在开发GPT-5,预计年内上线;DeepSeek R2也有望在今年下半年推出。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1