近日,DeepSeek-V4预览版本上线并同步开源,包含DeepSeek-V4-Pro和DeepSeek-V4-Flash两个模型。
与此前主要基于英伟达CUDA框架运行的模型不同,此次DeepSeek-V4在英伟达GPU和华为昇腾NPU上均完成细粒度专家并行(EP)方案验证。预计2026年下半年昇腾950超节点批量上市后,DeepSeek-V4-Pro价格将大幅下调。
目前华为昇腾超节点全系列产品已支持DeepSeek V4系列模型,实现DeepSeek-V4-Pro 20ms和DeepSeek-V4-Flash 10ms低时延推理。沐曦、寒武纪、摩尔线程、天数智芯等国产芯片厂商亦宣布支持DeepSeek-V4新模型。
中国信息通信研究院联合人工智能软硬件协同创新与适配验证中心,已启动DeepSeek V4国产化适配测试工作,覆盖芯片、服务器、一体机、集群、开发框架及工具链、智算设施及平台等人工智能软硬件产品及系统。
沐曦股份携手FlagOS完成DeepSeek-V4-Flash的Day 0适配,并联合上海人工智能实验室KernelSwift智能算子迁移系统,率先完成DeepSeek-V4核心算子的Day 0适配。
由智源研究院牵头研发的众智FlagOS,已完成DeepSeek-V4-Flash在海光、沐曦、华为昇腾、摩尔线程(FP8)、昆仑芯、平头哥真武、天数智芯等8款以上国产AI芯片上的全量适配与推理部署;FlagOS正推进DeepSeek-V4-Pro在多个芯片的迁移适配,后续将开源。
IDC中国研究经理索引指出,DeepSeek全面适配昇腾芯片,表明AI算力底座正朝多样化路径发展,该趋势对AI产业发展具有推动作用。CIC灼识咨询董事总经理陈一心表示,此次适配昇腾950PR是对国产高端芯片在复杂推理场景下性能的重要公开检验,将为后续模型与应用迁移提供范本。
陈一心强调,DeepSeek适配行动实质是将开发者生态与模型应用生态向国产算力平台牵引,有助于打破对英伟达CUDA生态的单一依赖,推动“国产算力+国产大模型”闭环生态成熟。
百度云千帆平台、阿里云百炼平台、华为云MaaS平台均已上线DeepSeek-V4-Pro或DeepSeek-V4-Flash API服务;PPIO成为业内最快上线该系列模型的AI云平台之一。阿里、字节跳动等头部云厂商已开始部署相关国产算力,推理侧国产算力已较成熟,训练侧正快速追赶,国产算力已成为AI云核心底座之一。
DeepSeek全系列API服务输入缓存命中价格已降至原价1/10;Pro模型于2026年5月5日前叠加2.5折限时优惠,输入(缓存命中)价格分别降至0.025元/百万Tokens(Pro)和0.02元/百万Tokens(Flash)。受限于高端算力,V4-Pro当前服务吞吐仍有限,待昇腾950超节点量产将显著释放供给能力。
陈一心指出,DeepSeek通过算法创新降低约60%训练成本;国产芯片厂商与其深度适配联合优化,进一步提升特定芯片推理效率,“算法+硬件”协同压低单次API调用计算成本,支撑模型供应商降价。索引表示,单位算力成本呈下降趋势,但算力总支出未减少;成本降低正扩大AI采用率与工作负载规模,形成人工智能驱动的宏观经济良性循环。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



