美团发布原生多模态大模型LongCat-Next

3月27日,美团正式发布并全面开源原生多模态大模型LongCat-Next及核心组件dNaViT视觉分词器。该模型首次实现图像、语音、文本统一映射为同源离散Token,摒弃传统以语言为中心的拼凑式架构,全程采用“下一个Token预测”(NTP)范式。此举旨在使视觉与语音成为AI的原生输入模态,提升多模态理解与生成能力。模型面向全球开发者开源,适用于本地化多模态应用开发。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1