2026年1月20日,恰逢DeepSeek-R1发布一周年,开发者在GitHub上发现其更新了114个文件,其中28处提及代号为“MODEL1”的新大模型。该标识符与现有“V32”模型并列出现,且在KV缓存布局、稀疏性处理和FP8解码支持等方面存在技术差异,暗示架构革新。结合此前发布的“优化残差连接”与“AI记忆模块”论文,推测V4或将集成这些新技术,提升内存效率与编程能力,预计于2月中旬农历新年期间发布。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。
2026年1月20日,恰逢DeepSeek-R1发布一周年,开发者在GitHub上发现其更新了114个文件,其中28处提及代号为“MODEL1”的新大模型。该标识符与现有“V32”模型并列出现,且在KV缓存布局、稀疏性处理和FP8解码支持等方面存在技术差异,暗示架构革新。结合此前发布的“优化残差连接”与“AI记忆模块”论文,推测V4或将集成这些新技术,提升内存效率与编程能力,预计于2月中旬农历新年期间发布。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。