AI推理芯片正成为产业新焦点,预计2025年中国市场规模将达3106亿元。
OpenAI近期与晶圆级AI芯片企业Cerebras签署协议,将在2026至2028年间将其750MW规模的芯片集成到AI推理计算资源库中,专门用于推理服务而非模型训练。
市场研究机构IDC中国副总裁周震刚表示,2024年中国数据中心加速卡中,推理卡占比达57.6%,训练卡占33%。随着DeepSeek等开源高性能大模型普及,小型公司算力需求从训练转向推理,腾讯、百度等平台接入进一步推动推理芯片增长,预计2025年推理芯片占比将持续大幅提升。
《2025-2030年人工智能芯片行业市场调研及投资前景预测报告》显示,中国AI推理芯片相关产品及服务市场规模以94.9%的复合年增长率扩张,从2020年的113亿元增至2024年的1626亿元,预计2025年将达到3106亿元。
生成式AI的广泛应用改变了算力需求结构。腾讯管理层在业绩交流会上指出,用户推理需求持续上升,已超过现有GPU资源供给能力。
智算中心建设也反映这一趋势。2024年12月,香港数码港人工智能超算中心投入运行,第二阶段规划算力达1700PFLOPS,预计2025年10月提升至3000PFLOPS,支持更多推理应用。
政策推动也是重要驱动因素。国家加快智慧城市和数字政府建设,带动对高效能比AI推理芯片的需求,以降低大型项目运算基础设施的运营成本。
国产芯片迎来发展机遇。2024年,国产算力在中国数据中心加速卡市场占比达34.6%,相较2022至2023年英伟达占据85%-90%份额的局面实现显著突破。
推理任务对芯片兼容性要求较训练更灵活,允许不同应用负载分配至不同芯片,使国产芯片可在非直接竞争场景下切入市场。
当前客户对国产芯片的关注已从与英伟达H100的对比转向实际部署,云厂商和AI厂商积极寻求英伟达之外的国产替代方案作为补充和备份。
极致性价比成为国产芯片关键优势。有业界人士表示,通过性能优化,国产芯片可在信创、交通、能源、通信等领域实现超越英伟达4090的性价比表现。
随着边缘设备智能化水平提升,从智能手表到工业机器人,推理芯片应用场景不断拓展。
推理芯片正摆脱训练芯片的附属地位,成为决定AI技术能否深入千行百业的核心变量。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



