月之暗面回应Kimi K2模型API延迟问题 承诺优化效率

月之暗面针对用户反映的Kimi K2模型API速度慢问题作出回应,称主要原因是访问量激增及模型体积较大。该公司表示,正全力优化推理效率,并增加服务器资源,预计未来几天性能将显著提升。

Kimi K2作为一款开源MoE架构模型,具备1T总参数和32B激活参数,擅长代码与通用Agent任务。月之暗面提到,用户可通过硅基流动、无问芯穹等供应商接入,也支持自行部署。目前,其API服务已全面上线,支持128K上下文,输入输出tokens计费分别为每百万4元和16元。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1