Meta开源MobileLLM：专精数理编程的小模型- DoNews

DoNews > 公司新闻 > Meta开源MobileLLM：专精数理编程的小模型

Meta开源MobileLLM：专精数理编程的小模型

推荐 2025-09-22 20:30:03

Meta近日发布了MobileLLM-R1系列小语言模型，提供1.4亿、3.6亿和9.5亿三种参数版本，专为在本地移动设备等轻量级平台上运行而设计。

该模型并非通用聊天机器人模型，而是通过监督式微调（SFT）专门针对数学、编程（如Python、C++）和科学类问题进行优化。以最大的MobileLLM-R1 950M为例，其预训练仅使用约2TB高质量token，总训练数据不足5TB，但在多项基准测试中表现优异。

在MATH、GSM8K、MMLU和LiveCodeBench等测试中，其性能超越了使用36TB token训练的Qwen 3-0.6B模型。与现有开源小模型相比，MobileLLM-R1 950M在MATH测试中的准确率是Olmo 1.24B的5倍，SmolLM 1.7B的2倍，在编程任务中也优于这两个模型。

开发者可通过vLLM推理引擎部署MobileLLM-R1，只需在ModelRegistry中注册Llama4ForCausalLM架构即可运行。该系列模型已依据Apache 2.0协议开源，并发布于Hugging Face平台。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

张雪峰回应账号被众多平台禁止关注：账号问题 9月24日，张雪峰多平台账号被禁关注，其回应称因账号问题所致。

消息称奔驰将投资吉利支持的千里科技奔驰拟投资重庆千里科技以提升软件实力，双方将展开研发合作，吉利主导推动并整合自动驾驶业务。

9月游戏版号下发，腾讯网易米哈游获批，多个国外大作过审 9月24日，国家新闻出版署发放145款国产和11款进口游戏版号，《归环》《星绘友晴天》等获批，《黑神话:悟空》增报XBOX版本。

一票难求与赔本赚吆喝？演唱会市场冰火两重天用情绪价值换票房。

张雪峰多个账号被禁止关注张雪峰多个社交平台账号被限制关注。

可灵2.5 Turbo 模型上线：价格较上代模型低近30% 可灵2.5 Turbo模型上线，生成效果行业领先，文本响应、动态表现大幅提升，性价比提高30%。

阿维塔战略2.0发布，阿维塔07 2026款正式上市六大神器、四大满配，重塑中型SUV价值锚点

在腾讯“科学探索奖”的年轻人，与他们的“好奇驱动”时代让科学家成为年轻人想追的“星”

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号