小米在12月18日举行的人车家全生态大会上,发布了由新任AI负责人罗福莉主导研发的大模型MiMo-V2-Flash。该模型参数规模为309B,激活参数15B,定位为Agent基座模型,强调高性价比与快速生成能力,可实现每秒150 tokens的推理速度。
罗福莉表示,MiMo-V2-Flash在代码能力和Agent能力方面已进入全球开源模型Top 1-2行列,多项评估基准表现超过或媲美DeepSeek-V3、Kimi K2-Thinking和Qwen等模型,但参数量仅为后者的1/2至1/3。在SWE-Bench Multilingual测试中,其成绩甚至优于包括GPT-5在内的多个闭源模型。
为提升效率,小米采用混合注意力机制,结合5:1比例的滑动窗口注意力(SWA)与全局注意力(GA),实验显示SWA在长文本处理和推理能力上优于线性注意力机制,并适配现有基础设施。API定价为输入0.7元/百万tokens、输出2.1元/百万tokens,相较Claude Sonnet 4.5,推理成本仅为2.5%,生成速度达其2倍。
尽管模型性能受到部分认可,外界评价呈现两极分化,有观点质疑其为“刷分”模型。小米强调该模型服务于“轻量化+端侧部署”战略,旨在通过低成本、高效能推动AI在智能终端落地。
小米集团总裁卢伟冰透露,2025年公司研发投入将超300亿元,其中约75亿元投向AI领域,未来五年总投入预计超2000亿元。组织层面,小米已搭建AI Infra平台,并拥有6500张GPU资源,正建设万卡集群以支持大模型训练。
人才布局方面,除罗福莉负责基础大模型外,陈龙加入智驾团队,推动跨具身(X-Embodied)基座模型MiMo-Embodied的研发,该模型于11月发布,致力于打通自动驾驶与机器人技术间的知识迁移障碍。
小米自2025年起密集推出MiMo系列模型:4月开源MiMo-7B系列;5月发布多模态模型MiMo-VL-7B;11月推出MiMo-Embodied;12月发布MiMo-V2-Flash。这一系列动作体现其构建统一AI逻辑驱动“人车家全生态”的战略意图。
雷军提出的小米AI战略聚焦于“轻量化+本地部署”,依托全球超10亿台设备的连接优势,将AI深度融入手机、智能家居及智能驾驶场景。MiMo-V2-Flash的发布不仅是技术展示,更是小米向资本市场传递转型信号的关键一环。
罗福莉指出,Scaling Law红利递减背景下,行业正从预训练转向后训练范式,强化学习成为关键。MiMo-V2-Flash优化方向集中于高效沟通、加速带宽与发力后训练三大维度,目标是打造具备物理一致性与时空连贯性的虚拟宇宙。
目前,309B参数规模仍难直接部署至端侧,小米需进一步压缩模型以实现在手机、汽车等设备上的广泛应用。最终成效取决于技术能否在实际设备中运行并转化为用户可感知的体验。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



