字节跳动正与天数智芯洽谈采购至少5万颗AI芯片,主要用于大模型推理负载,对应天数智芯智铠系列云端推理GPU;训练场景则采用天垓系列。若交易达成,天数智芯将成为继华为、寒武纪之后字节跳动第三家GPU供应商。
字节跳动明确训练与推理芯片供应链完全拆分:大规模模型训练采用华为昇腾、寒武纪高端训练卡;线上C端豆包及企业MaaS海量并发推理引入天数智芯智铠系列等专用推理GPU。华为昇腾聚焦集群训练与超大规模模型预训练底座;寒武纪兼顾部分中高端推理及垂直行业私有化部署;天数智芯智铠侧重线上流量型海量推理主力供给。
除字节跳动外,百度在全国布局万卡级AI算力集群;阿里巴巴2026财年单季度资本开支超380亿元,预计未来三年超3800亿元加码云和智算硬件;腾讯在全国多地建设HCC高性能AI集群,2026年下半年大规模导入国产算力,并对外提供混元大模型MaaS、游戏AIGC及视频生成推理服务。
面壁智能AI Infra技术负责人李宇轩指出,互联网大厂构建多供应商算力体系主要基于供给确定性、议价权与成本结构。推理体量远大于训练,且对芯片互联、显存带宽、生态成熟度要求低于训练,国产芯片在推理侧已达可用水平,进入规模化部署窗口。
信创国产化是面向政企、央国企业务的硬性合规要求,多技术路线并行可保留技术选择空间,避免受单一厂商硬件与生态迭代节奏束缚。沂景资本董事总经理谢思远表示,部分互联网厂商重要客户来自国企及关键行业,算力体系建设中更重视国产化能力与信创适配要求;当前互联网厂商与国产芯片厂商仍处于持续磨合与博弈阶段。
清微智能高级副总裁卢强指出,推进算力供应链多元化的主因是需求、供给与供应链安全多维叠加。海外高端芯片出口管制导致供给不确定,国产推理芯片在特定场景下性价比、交付可控性与本地化服务能力提升,已从PoC验证进入规模化部署窗口。
曦望Sunrise联席CEO王湛表示,2026年国内大模型进入应用爆发期,Token市场扩张与Agent普及使行业竞争焦点转向‘谁的Token成本更低’。国产推理芯片在高并发推理场景如搜索推荐、智能客服、短视频多模态生成,以及MoE架构常态化训练与微调中表现突出。灼识咨询预测,2030年全球AI推理芯片市场规模达30696亿元,其中中国达11664亿元。
优刻得新兴事业部副总经理刘华判断,办公场景与业务AI化将持续推高算力需求,AI行业3–5年内仍将高速发展。王湛指出,当前市场出现‘一卡难求’,头部企业抢购GPU卡、内存及数据中心资源,导致供应链承压;一季度算力租赁成本上涨30%–40%,全年AI推理算力需求预计为训练的4–5倍。卢强称,短缺集中于高端AI加速卡、HBM、先进封装及整机服务器环节,交付周期拉长、热门型号排产紧张、整机报价波动上行。
香港理工大学研究显示,在超大规模云端设置中,推理能耗占AI总能耗约60%–90%;中国工程院指出,2026年一季度中国推理需求已达训练需求的8倍。交银国际研报认为,支撑大规模推理任务的高密度、低延迟算力需求将成为数据中心增长主力;国产GPU扩产叠加超大型云厂商订单释放,预计2026年下半年项目落地节奏将加快。
刘华表示,英伟达供应压力将促进国产算力成长,当前国产芯片因产能与适配问题供货受限,但将逐步放量。受地缘出口管制约束,国内产业短期内仍需采购英伟达高端算力补充,但具备替代能力的国产算力生态已进入规模化建设落地阶段。
字节跳动等互联网厂商短期靠采购满足需求,中期靠国产多供应商降低风险与成本,长期靠自研实现利润留存。训练、精调、高并发推理、图像处理等多元场景对算力需求各异,多供应商体系支持用不同芯片分别承担,以实现TCO最优化。谢思远强调,核心考量仍是性价比——最终决策取决于实际部署后的成本、性能与稳定性综合表现。行业正从‘可用验证’迈向‘规模使用’,客户关注点由单卡指标转向千卡、万卡集群稳定性与单位成本。大订单改善厂商收入、现金流与供应链议价能力,但格局最终由产品迭代、生态、交付与客户复购决定。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



