小米发布MiMo-V2系列三款大模型,聚焦多模态Agent基建

3月19日,小米正式推出MiMo-V2系列三款大模型:Pro、Omni和TTS。该系列已上线Xiaomi miclaw、MiMo Studio、金山办公及小米浏览器,并通过OpenClaw、OpenCode、KiloCode、Blackbox、Cline等平台接入,提供限时免费体验一周。

MiMo-V2-Pro面向高强度Agent工作场景,总参数量超1T(42B激活参数),采用混合注意力架构,支持1M超长上下文长度。其在Artificial Analysis排行榜位列全球第八、国内第二。此前代号为“Hunter Alpha”的模型在OpenRouter平台七日内调用量突破1万亿Token,被证实为MiMo-V2-Pro的内部测试版本,主要应用于代码生成与开发工具领域。

MiMo-V2-Pro具备任务闭环执行能力,可在单次提示中完成从设计到实现的完整流程,解决Agent“大脑”逻辑问题。MiMo-V2-Omni作为全模态基座模型,实现音频、图像、视频跨模态对齐,支撑Agent基于视听信息感知世界并生成指令。MiMo-V2-TTS为小米自研语音合成大模型,采用自研Audio Tokenizer与多码本联合建模架构,支持语音风格与情绪的精准调节。

三款模型协同构成覆盖感知、决策与表达的多模态Agent基础设施,标志着小米大模型战略由单一文本交互转向可闭环的多模态智能体底层构建。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1