微软发布开源三值大模型BitNet b1.58 2B4T，能效比显著提升- DoNews快讯

DoNews > 快讯 > 微软发布开源三值大模型BitNet b1.58 2B4T，能效比显著提升

微软发布开源三值大模型BitNet b1.58 2B4T，能效比显著提升

2025-04-18 09:00:02

282227

微软研究团队近日推出开源大型语言模型BitNet b1.58 2B4T，采用创新的1.58位低精度架构原生训练，性能接近同规模全精度模型，但资源占用大幅降低。该模型仅需0.4GB非嵌入内存，远低于Gemma-3 1B等竞品。

BitNet的核心突破在于其三值权重系统（-1、0、+1），结合8位整数量化激活值，形成W1.58A8配置，并通过改进Transformer架构确保训练稳定性。测试显示，其在数学、物理常识等任务中表现优异，能耗低至每token 0.028焦耳。

目前，该模型已开源，但需配合微软专用框架以发挥效能优势。未来微软计划扩展多语言支持及硬件优化，进一步挖掘低位模型的潜力。

哪吒汽车App又被曝断网、官网已无法访问；微软上调Xbox售价；2025五一档票房破6亿｜Do早报今日早报已为你呈上～

爱彼迎：一季度总收入约23亿美元，将拓展住宿以外的新领域净利润同比减少42%。

中国短剧，凭什么让全球观众“上头”？全球都在看短剧？

兆易创新 2024 年营收增长 27.69%，2025 年 Q1 营收同比提升 17.32% Fabless 半导体企业。

“柴怼怼”29条视频被下架；多国零售商停止向美国发货；黄仁勋基本工资十年来首次增长｜Do早报先来浏览新鲜的早报吧

生态体系缺位，德施曼难敌小米和华为德施曼难以构建起真正的竞争优势。

亚马逊 2025Q1 营收 1556.67 亿美元净利润同比增长 64%。

Meta 公布 2025 财年第 1 财季财报：营收 423.14 亿美元同比增长 16%。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
违法和不良信息举报电话：010-87538607 邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号