美团发布轻量化MoE模型LongCat-Flash-Lite

美团于2026年2月6日正式发布LongCat-Flash-Lite模型,该模型采用混合专家(MoE)架构,总参数量为685亿,单次推理仅激活29亿至45亿参数。

模型应用YARN技术,支持最长256K上下文长度,适用于长文档分析与大规模代码处理等复杂任务;官方称其性能超越参数量等效的基准模型,在同规模模型中具备较强竞争力。

在推理效率方面,该模型在典型输入输出负载下生成速度达每秒500至700个token;美团同步开放API接口,开发者可通过其开放平台申请使用,每日享有5000万token免费额度。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

Copyright © DoNews 2000-2026 All Rights Reserved
京ICP备2025120072号