DeepSeek-V4完成多国产芯片适配，AI算力底座迈向多样化- DoNews

近日，DeepSeek-V4预览版本上线并同步开源，包含DeepSeek-V4-Pro和DeepSeek-V4-Flash两个模型。

与此前主要基于英伟达CUDA框架运行的模型不同，此次DeepSeek-V4在英伟达GPU和华为昇腾NPU上均完成细粒度专家并行（EP）方案验证。预计2026年下半年昇腾950超节点批量上市后，DeepSeek-V4-Pro价格将大幅下调。

目前华为昇腾超节点全系列产品已支持DeepSeek V4系列模型，实现DeepSeek-V4-Pro 20ms和DeepSeek-V4-Flash 10ms低时延推理。沐曦、寒武纪、摩尔线程、天数智芯等国产芯片厂商亦宣布支持DeepSeek-V4新模型。

中国信息通信研究院联合人工智能软硬件协同创新与适配验证中心，已启动DeepSeek V4国产化适配测试工作，覆盖芯片、服务器、一体机、集群、开发框架及工具链、智算设施及平台等人工智能软硬件产品及系统。

沐曦股份携手FlagOS完成DeepSeek-V4-Flash的Day 0适配，并联合上海人工智能实验室KernelSwift智能算子迁移系统，率先完成DeepSeek-V4核心算子的Day 0适配。

由智源研究院牵头研发的众智FlagOS，已完成DeepSeek-V4-Flash在海光、沐曦、华为昇腾、摩尔线程（FP8）、昆仑芯、平头哥真武、天数智芯等8款以上国产AI芯片上的全量适配与推理部署；FlagOS正推进DeepSeek-V4-Pro在多个芯片的迁移适配，后续将开源。

IDC中国研究经理索引指出，DeepSeek全面适配昇腾芯片，表明AI算力底座正朝多样化路径发展，该趋势对AI产业发展具有推动作用。CIC灼识咨询董事总经理陈一心表示，此次适配昇腾950PR是对国产高端芯片在复杂推理场景下性能的重要公开检验，将为后续模型与应用迁移提供范本。

陈一心强调，DeepSeek适配行动实质是将开发者生态与模型应用生态向国产算力平台牵引，有助于打破对英伟达CUDA生态的单一依赖，推动“国产算力+国产大模型”闭环生态成熟。

百度云千帆平台、阿里云百炼平台、华为云MaaS平台均已上线DeepSeek-V4-Pro或DeepSeek-V4-Flash API服务；PPIO成为业内最快上线该系列模型的AI云平台之一。阿里、字节跳动等头部云厂商已开始部署相关国产算力，推理侧国产算力已较成熟，训练侧正快速追赶，国产算力已成为AI云核心底座之一。

DeepSeek全系列API服务输入缓存命中价格已降至原价1/10；Pro模型于2026年5月5日前叠加2.5折限时优惠，输入（缓存命中）价格分别降至0.025元/百万Tokens（Pro）和0.02元/百万Tokens（Flash）。受限于高端算力，V4-Pro当前服务吞吐仍有限，待昇腾950超节点量产将显著释放供给能力。

陈一心指出，DeepSeek通过算法创新降低约60%训练成本；国产芯片厂商与其深度适配联合优化，进一步提升特定芯片推理效率，“算法+硬件”协同压低单次API调用计算成本，支撑模型供应商降价。索引表示，单位算力成本呈下降趋势，但算力总支出未减少；成本降低正扩大AI采用率与工作负载规模，形成人工智能驱动的宏观经济良性循环。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。