巴西里约热内卢市政府发布的Rio 3.5模型被证实六成权重源自中国Nex-AGI的Nex-N2-Pro,四成为阿里Qwen,未进行实质性训练,仅按比例拼接。该模型在删除预设提示后,近八成概率自称为“Nex”,零次认领“Rio”身份,里约方面随后致歉称上传了错误版本。
类似案例包括日本乐天Rakuten AI,其底层架构被确认基于DeepSeek模型,虽后续进行了定制化开发,但初期未披露来源,事后方予承认。此外,GLM 5.2、MiniMax M3等中国开源模型近期在海外技术社区引发广泛讨论与实际部署。
Artificial Analysis新版智能指数评测显示,Claude Opus 4.8得分为56分,为当前可商用闭源模型最高;开源模型中MiniMax M3与DeepSeek V4 Pro同获44分,但单任务成本仅为Opus的约十分之一(0.18美元 vs 1.78美元)。在客服、分类、信息抽取、代码审查等多数实用场景中,M3表现稳定,甚至在OpenCode实测中检出GPT未识别的代码问题。
Airbnb公开采用中国开源模型构建客服Agent,Notion Custom Agents、OpenCode等平台已将DeepSeek与M3列为调用量前二模型;OpenCode为M3提供限时三倍额度,联合创始人Jay V评价其“涨得出奇地好”。Fireworks、Together、Ollama等海外主流推理平台均已集成DeepSeek与M3;Nous Research旗下Hermes Agent框架完成对MiniMax官方适配,并宣布将开展产品与模型层面合作。
全球开源模型供给格局正发生结构性变化。Meta Llama曾主导开源生态,但其旗舰Behemoth模型仍未开放权重,且已发布首个闭源前沿模型;OpenAI仅于2025年发布一次gpt-oss后未再更新;Anthropic不开放权重;法国Mistral退出第一梯队。目前持续维护前沿规模开源权重的主体主要集中于中国:Qwen、DeepSeek、GLM、MiniMax保持高频迭代,覆盖多尺寸、多模态及编程专项模型,2025年曾出现三周内四家中国机构连发四个开放编程模型的现象。
ATOM项目统计显示,2023年末至2025年中,全球新增开源衍生模型中约70%基于Qwen,Llama占比则由两年前超40%降至约10%。AI研究者Nathan Lambert指出,美国已在开源模型性能与采用率上失去领先优势。OpenRouter周用量榜前列几乎全为中国模型,包括DeepSeek、MiniMax M3与腾讯混元;而靠前的美国模型多属闭源Claude系列。
国内对国产模型的实际应用并未滞后:多个团队以Qwen、DeepSeek、MiniMax为底座开发产品。但公开讨论焦点常偏离技术能力,转向计费策略与服务规则。MiniMax M3发布同期,海外媒体与Vercel CEO在X平台盛赞其性价比与Agent性能,国内社区则集中争议套餐变更与权益缩水,最终MiniMax致歉并补偿;GLM新套餐亦因放量机制与升级规则遭质疑,智谱AI同样公开致歉并提供退款。国内舆论还叠加双重特殊期待:一是将其视为中国AI原创性的标尺,严查是否蒸馏或跟随;二是直接对标Claude、GPT等闭源SOTA上限,弱化其在可用性、可控性与成本维度的现实价值。DeepSeek先于美国App Store登顶并引发全球资本重估AI成本,才带动国内重新审视,此类“海外先行验证、国内滞后认知”的路径已在多个中国开源模型身上复现。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



