7月11日晚,国内大模型公司月之暗面发布并开源新一代MoE架构基础模型Kimi K2,参数总量达1万亿。多位参与研发的工程师在知乎分享研发历程。Kimi内部将K2研发群称为“接生群”。知乎答主刘少伟介绍,K2基于DeepSeek V3结构,在控制训练与推理成本前提下,实现更低的loss表现。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。
7月11日晚,国内大模型公司月之暗面发布并开源新一代MoE架构基础模型Kimi K2,参数总量达1万亿。多位参与研发的工程师在知乎分享研发历程。Kimi内部将K2研发群称为“接生群”。知乎答主刘少伟介绍,K2基于DeepSeek V3结构,在控制训练与推理成本前提下,实现更低的loss表现。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。