字节跳动拟采购5万颗天数智芯AI推理芯片- DoNews

字节跳动正与天数智芯洽谈采购至少5万颗AI芯片，主要用于大模型推理负载，对应天数智芯智铠系列云端推理GPU；训练场景则采用天垓系列。若交易达成，天数智芯将成为继华为、寒武纪之后字节跳动第三家GPU供应商。

字节跳动明确训练与推理芯片供应链完全拆分：大规模模型训练采用华为昇腾、寒武纪高端训练卡；线上C端豆包及企业MaaS海量并发推理引入天数智芯智铠系列等专用推理GPU。华为昇腾聚焦集群训练与超大规模模型预训练底座；寒武纪兼顾部分中高端推理及垂直行业私有化部署；天数智芯智铠侧重线上流量型海量推理主力供给。

除字节跳动外，百度在全国布局万卡级AI算力集群；阿里巴巴2026财年单季度资本开支超380亿元，预计未来三年超3800亿元加码云和智算硬件；腾讯在全国多地建设HCC高性能AI集群，2026年下半年大规模导入国产算力，并对外提供混元大模型MaaS、游戏AIGC及视频生成推理服务。

面壁智能AI Infra技术负责人李宇轩指出，互联网大厂构建多供应商算力体系主要基于供给确定性、议价权与成本结构。推理体量远大于训练，且对芯片互联、显存带宽、生态成熟度要求低于训练，国产芯片在推理侧已达可用水平，进入规模化部署窗口。

信创国产化是面向政企、央国企业务的硬性合规要求，多技术路线并行可保留技术选择空间，避免受单一厂商硬件与生态迭代节奏束缚。沂景资本董事总经理谢思远表示，部分互联网厂商重要客户来自国企及关键行业，算力体系建设中更重视国产化能力与信创适配要求；当前互联网厂商与国产芯片厂商仍处于持续磨合与博弈阶段。

清微智能高级副总裁卢强指出，推进算力供应链多元化的主因是需求、供给与供应链安全多维叠加。海外高端芯片出口管制导致供给不确定，国产推理芯片在特定场景下性价比、交付可控性与本地化服务能力提升，已从PoC验证进入规模化部署窗口。

曦望Sunrise联席CEO王湛表示，2026年国内大模型进入应用爆发期，Token市场扩张与Agent普及使行业竞争焦点转向‘谁的Token成本更低’。国产推理芯片在高并发推理场景如搜索推荐、智能客服、短视频多模态生成，以及MoE架构常态化训练与微调中表现突出。灼识咨询预测，2030年全球AI推理芯片市场规模达30696亿元，其中中国达11664亿元。

优刻得新兴事业部副总经理刘华判断，办公场景与业务AI化将持续推高算力需求，AI行业3–5年内仍将高速发展。王湛指出，当前市场出现‘一卡难求’，头部企业抢购GPU卡、内存及数据中心资源，导致供应链承压；一季度算力租赁成本上涨30%–40%，全年AI推理算力需求预计为训练的4–5倍。卢强称，短缺集中于高端AI加速卡、HBM、先进封装及整机服务器环节，交付周期拉长、热门型号排产紧张、整机报价波动上行。

香港理工大学研究显示，在超大规模云端设置中，推理能耗占AI总能耗约60%–90%；中国工程院指出，2026年一季度中国推理需求已达训练需求的8倍。交银国际研报认为，支撑大规模推理任务的高密度、低延迟算力需求将成为数据中心增长主力；国产GPU扩产叠加超大型云厂商订单释放，预计2026年下半年项目落地节奏将加快。

刘华表示，英伟达供应压力将促进国产算力成长，当前国产芯片因产能与适配问题供货受限，但将逐步放量。受地缘出口管制约束，国内产业短期内仍需采购英伟达高端算力补充，但具备替代能力的国产算力生态已进入规模化建设落地阶段。

字节跳动等互联网厂商短期靠采购满足需求，中期靠国产多供应商降低风险与成本，长期靠自研实现利润留存。训练、精调、高并发推理、图像处理等多元场景对算力需求各异，多供应商体系支持用不同芯片分别承担，以实现TCO最优化。谢思远强调，核心考量仍是性价比——最终决策取决于实际部署后的成本、性能与稳定性综合表现。行业正从‘可用验证’迈向‘规模使用’，客户关注点由单卡指标转向千卡、万卡集群稳定性与单位成本。大订单改善厂商收入、现金流与供应链议价能力，但格局最终由产品迭代、生态、交付与客户复购决定。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。