月之暗面针对用户反映的Kimi K2模型API速度慢问题作出回应,称主要原因是访问量激增及模型体积较大。该公司表示,正全力优化推理效率,并增加服务器资源,预计未来几天性能将显著提升。
Kimi K2作为一款开源MoE架构模型,具备1T总参数和32B激活参数,擅长代码与通用Agent任务。月之暗面提到,用户可通过硅基流动、无问芯穹等供应商接入,也支持自行部署。目前,其API服务已全面上线,支持128K上下文,输入输出tokens计费分别为每百万4元和16元。
月之暗面针对用户反映的Kimi K2模型API速度慢问题作出回应,称主要原因是访问量激增及模型体积较大。该公司表示,正全力优化推理效率,并增加服务器资源,预计未来几天性能将显著提升。
Kimi K2作为一款开源MoE架构模型,具备1T总参数和32B激活参数,擅长代码与通用Agent任务。月之暗面提到,用户可通过硅基流动、无问芯穹等供应商接入,也支持自行部署。目前,其API服务已全面上线,支持128K上下文,输入输出tokens计费分别为每百万4元和16元。