美团于2026年2月6日正式发布LongCat-Flash-Lite模型,该模型采用混合专家(MoE)架构,总参数量为685亿,单次推理仅激活29亿至45亿参数。
模型应用YARN技术,支持最长256K上下文长度,适用于长文档分析与大规模代码处理等复杂任务;官方称其性能超越参数量等效的基准模型,在同规模模型中具备较强竞争力。
在推理效率方面,该模型在典型输入输出负载下生成速度达每秒500至700个token;美团同步开放API接口,开发者可通过其开放平台申请使用,每日享有5000万token免费额度。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



