中国开源大模型成全球开发者主流底座- DoNews

巴西里约热内卢市政府发布的Rio 3.5模型被证实六成权重源自中国Nex-AGI的Nex-N2-Pro，四成为阿里Qwen，未进行实质性训练，仅按比例拼接。该模型在删除预设提示后，近八成概率自称为“Nex”，零次认领“Rio”身份，里约方面随后致歉称上传了错误版本。

类似案例包括日本乐天Rakuten AI，其底层架构被确认基于DeepSeek模型，虽后续进行了定制化开发，但初期未披露来源，事后方予承认。此外，GLM 5.2、MiniMax M3等中国开源模型近期在海外技术社区引发广泛讨论与实际部署。

Artificial Analysis新版智能指数评测显示，Claude Opus 4.8得分为56分，为当前可商用闭源模型最高；开源模型中MiniMax M3与DeepSeek V4 Pro同获44分，但单任务成本仅为Opus的约十分之一（0.18美元 vs 1.78美元）。在客服、分类、信息抽取、代码审查等多数实用场景中，M3表现稳定，甚至在OpenCode实测中检出GPT未识别的代码问题。

Airbnb公开采用中国开源模型构建客服Agent，Notion Custom Agents、OpenCode等平台已将DeepSeek与M3列为调用量前二模型；OpenCode为M3提供限时三倍额度，联合创始人Jay V评价其“涨得出奇地好”。Fireworks、Together、Ollama等海外主流推理平台均已集成DeepSeek与M3；Nous Research旗下Hermes Agent框架完成对MiniMax官方适配，并宣布将开展产品与模型层面合作。

全球开源模型供给格局正发生结构性变化。Meta Llama曾主导开源生态，但其旗舰Behemoth模型仍未开放权重，且已发布首个闭源前沿模型；OpenAI仅于2025年发布一次gpt-oss后未再更新；Anthropic不开放权重；法国Mistral退出第一梯队。目前持续维护前沿规模开源权重的主体主要集中于中国：Qwen、DeepSeek、GLM、MiniMax保持高频迭代，覆盖多尺寸、多模态及编程专项模型，2025年曾出现三周内四家中国机构连发四个开放编程模型的现象。

ATOM项目统计显示，2023年末至2025年中，全球新增开源衍生模型中约70%基于Qwen，Llama占比则由两年前超40%降至约10%。AI研究者Nathan Lambert指出，美国已在开源模型性能与采用率上失去领先优势。OpenRouter周用量榜前列几乎全为中国模型，包括DeepSeek、MiniMax M3与腾讯混元；而靠前的美国模型多属闭源Claude系列。

国内对国产模型的实际应用并未滞后：多个团队以Qwen、DeepSeek、MiniMax为底座开发产品。但公开讨论焦点常偏离技术能力，转向计费策略与服务规则。MiniMax M3发布同期，海外媒体与Vercel CEO在X平台盛赞其性价比与Agent性能，国内社区则集中争议套餐变更与权益缩水，最终MiniMax致歉并补偿；GLM新套餐亦因放量机制与升级规则遭质疑，智谱AI同样公开致歉并提供退款。国内舆论还叠加双重特殊期待：一是将其视为中国AI原创性的标尺，严查是否蒸馏或跟随；二是直接对标Claude、GPT等闭源SOTA上限，弱化其在可用性、可控性与成本维度的现实价值。DeepSeek先于美国App Store登顶并引发全球资本重估AI成本，才带动国内重新审视，此类“海外先行验证、国内滞后认知”的路径已在多个中国开源模型身上复现。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。