稀宇科技推出新一代01系列模型,突破传统AI架构限制

稀宇科技(MiniMax)今日宣布推出新一代01系列模型,包括基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。为方便开发者研究,该公司已在Github上开源了两个模型的完整权重,后续更新将陆续上传。

该系列模型首次大规模实现线性注意力机制,突破了Transformer架构的记忆瓶颈,能够处理400万token的输入,输入长度分别是GPT-4o的32倍和Claude-3.5-Sonnet的20倍。模型参数量高达4560亿,单次激活459亿,综合性能比肩海外顶尖模型,在大多数任务上追平了GPT-4o-1120和Claude-3.5-Sonnet-1022。

在长文任务上,MiniMax-Text-01性能衰减更少,显著优于谷歌Gemini,处理长输入时效率极高,接近线性复杂度。定价方面,标准定价为输入1元/百万输入token、8元/百万输出token。

免责声明:本文内容由开放的智能模型自动生成,仅供参考,不构成任何专业建议或决策依据。用户应自行核实信息的准确性和可靠性,本站对用户因使用或依赖本文内容而产生的任何风险或损失不承担任何责任。如有疑问或发现内容有误,请联系本站进行处理。

最新文章
Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1