小红书开源高效能MOE模型dots.llm1系列- DoNews

DoNews > 公司新闻 > 小红书开源高效能MOE模型dots.llm1系列

小红书开源高效能MOE模型dots.llm1系列

推荐 2025-06-11 09:18:02

小红书近期开源了MOE模型dots.llm1系列，该模型总参数量达1420亿，在推理时仅激活140亿参数，性能可比肩Qwen2.5-72B等先进模型。

dots.llm1采用三阶段数据处理框架，使用高质量非合成语料进行预训练，并通过细粒度MoE架构（从128个专家中选择6个加上2个共享专家）和QK-Norm技术提升计算效率。模型支持32K长上下文，涵盖中英双语，基于MIT许可证开源，包含预训练基模型与指令微调模型。

此外，研究团队还开放了完整的训练过程中间检查点，以展示大模型的学习动态。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

川润股份上半年营收增长25.08% 川润股份上半年营收8.04亿元，同比增长25.08%，净亏损收窄至2357.15万元，子公司川润液压业绩增长成主因。

猛士M817正式上市售价31.99万元起全栈华为满配加持，猛士M817让越野更智能！

一亩田今日正式登陆纳斯达克一亩田集团于2025年8月19日以YMT代码在纳斯达克上市，成为首家中国农业全产业链互联网企业，发行价4.1美元，募资约2200万美元。

广汽昊铂HL增程版正式上市售价26.98万起广汽昊铂HL增程版正式上市

三千里奔赴山城，问界M9“库里战车”点燃球迷热爱问界M9载满球迷的“情书”，驶向库里。

DeepSeek V3.1上线，R2发布时间仍未明确 DeepSeek升级模型至V3.1，上下文长度达128k，增强长文档分析与代码理解能力。

索要200万月薪董事长或被解聘伯朗特股东会通过章程修改，董事会人数由7人减至5人，股东李博铮计划罢免董事长尹荣造，引发公司治理争议。

中国佛教协会再谈释永信被查释永信涉嫌挪用资金犯罪，严重违反佛教戒律和法律，强调佛教徒必须守法遵规，维护国家利益和法治秩序。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号