MiniMax 稀宇科技发布万亿参数 MoE 模型 abab 6.5，核心能力接近 GPT-4- DoNews

DoNews > 公司新闻 > MiniMax 稀宇科技发布万亿参数 MoE 模型 abab 6.5，核心能力接近 GPT-4

MiniMax 稀宇科技发布万亿参数 MoE 模型 abab 6.5，核心能力接近 GPT-4

IT之家 2024-04-17 14:50:25

国内 AI 初创企业 MiniMax 稀宇科技今日正式推出 MoE 混合专家模型架构的 abab 6.5 系列模型，核心能力开始接近 GPT-4、 Claude-3、 Gemini-1.5。

abab 6.5 系列包含两个模型：

abab 6.5：包含万亿参数，支持 200k tokens 的上下文长度；
abab 6.5s：与 abab 6.5 使用了同样的训练技术和数据，但是更高效，支持 200k tokens 的上下文长度，可以 1 秒内处理近 3 万字的文本。

自一月发布国内首个基于 MoE 架构的 abab 6 模型后，MiniMax 通过改进模型架构，重构数据 pipeline，训练算法及并行训练策略优化等，在加速 Scaling Laws 过程上取得阶段性成果。

IT之家附 abab 6.5 系列模型测试结果如下：

官方在 200k token 内进行了业界常用的“大海捞针”测试，即在很长的文本中放入一个和该文本无关的句子（针），然后通过自然语言提问模型，看模型是否准确将这个针回答出来。在 891 次测试中，abab 6.5 均能正确回答。

▲ 海螺 AI 页面

abab 6.5 与 abab 6.5s 模型将滚动更新至 MiniMax 旗下产品，包括海螺 AI 与 MiniMax 开放平台。

本文转载自IT之家，转载目的在于传递更多信息，并不代表本站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请联系IT之家通知我方删除，我方将在收到通知后第一时间删除内容！本文只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权。

东风纳米06正式上市限时先享价7.99万元起限时先享价7.99万元起

雷鸟创新发布雷鸟X3 Pro等多款新品开启智能计算终端新纪元

一加Ace 5 至尊系列发布售价 2499 元起一加发布Ace 5至尊系列

拼多多 2025 年第一季度营收 956.7 亿元，同比增长 10% 拼多多Q1营收956.7亿，净利147.4亿同比下滑47%，研发支出35.8亿，盘前跌12%。

深蓝汽车向车主投放降价广告惹争议，客服回应深蓝汽车未经同意向48万老车主投放车机开屏广告，引发不满，客服称仅为首任车主一次感恩回馈。

快手 2025 年第一季度营收 326.1 亿元，同比增长 10.9% 快手Q1营收326.1亿，净利45.8亿；日活4.08亿，月活7.12亿，电商GMV达3323亿，可灵AI收入超1.5亿。

吉利银河E5神盾金砖电池顺利完成36吨极限抗压试炼吉利银河E5神盾金砖电池通过36吨极限抗压试验，超出“新国标”1.8倍要求，保障电车安全，树立15万级新能源安全标杆。

知乎 2025 年一季度净亏损 1010 万元，同比收窄 93.9% 知乎2025年Q1总收入7.29亿，净亏损收窄93.9%，付费阅读业务占比57.3%，首次实现第一季度Non-GAAP盈利。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号