重押数据流架构，理想又要成为车圈新“过河石头”？- DoNews专栏

文/周雄飞

“过去四年中，有些人摸着理想过河，有些人直接跟着理想过河”。

在本月的全新一代理想L9上市发布会上，理想汽车CEO李想用这句话作为开头。

因为在他看来，此前被行业质疑的增程动力和“冰箱彩电大沙发”，现在已被车圈广泛采用。就拿目前卷得火热的“9系”市场来看，这两方面已成产品标配，以至于出现了“9系车都从一个模子里造出来”的观感。

在此行业背景下，全新L9像四年前那样，又走上了少有人走的路。

全新理想L9分为Ultra版和Livis版两个版本，售价为45.98-50.98万元，其中理想L9 Livis凭借800V全主动悬架、行业首个“完全体”全线控底盘，以及理想自研的马赫M100芯片等，成为行业及消费者的关注焦点，上市后前两周大定破万。

对于马赫M100芯片，理想官方花了较大的篇幅进行介绍——采用了数据流架构、5nm制程工艺的端侧原生AI推理芯片，单颗芯片算力达到1280TOPS，搭载两颗芯片的Livis版本车端算力可达到2560TOPS。

单从数据流架构看，理想并不是首创的玩家，早在1970年该架构理论就已出现，随后AI行业也有一些企业采用这一架构来设计芯片，但理想算是行业中首个基于动态数据流架构量产大算力车规级芯片的玩家。

相较于传统冯·诺依曼架构，动态数据流架构的优势在于数据就绪即触发计算，近存计算可大幅降低“内存墙”影响，进而大幅提升智能辅助驾驶、自动驾驶以及具身智能等物理AI的运算效率和精度。

作为“率先吃螃蟹”的玩家，理想虽然要长期布局编译器、软件栈等软硬一体基础设施，以及验证算法模型的能力水平，但在业内看来，基于马赫M100芯片的逐步量产、内部团队的深度融合协作和充足的现金储备支持，马赫M100芯片大概率会成功，从而吸引更多玩家跟进，再次出现“摸着理想过河”的场景。

只不过，距离那一天应该还有些距离。那么，李想和理想汽车为此准备好了吗？

1、数据流架构十多年变迁，从实验室理论到车规级量产

当理想在2021年决定开始自研芯片时，他们站在一个岔路口上。

一条路是继续沿用传统冯·诺依曼架构来打造，另一条路则是设计更适合通用物理AI发展的新芯片架构。结果表明，理想他们选择了后面这条更难的路。

会做出这样的选择，也许是他们看到了冯·诺依曼架构的局限性。基于该架构的运算特性，数据需要从内存加载到缓存，再进入到计算单元处理，完成后再写回内存，然后到下一级计算单元。

看似井然有序，但这个过程中计算单元有大量的时间在等数据的来回“搬运”，这也是行业内俗称的“内存墙”问题。

就好比一个工厂，上个车间制造完零件后，先储存到仓库，下一个车间则需要先去仓库取零件才能开工，且搬运时间很长，中间的搬运时间全是浪费。回归到芯片性能表现上，虽然计算得较快，但数据传输跟不上且能耗巨大。

“AI发展到2020年之后，当计算规模扩大到一定程度后，传统的冯·诺依曼架构已经成为一个限制因素。而数据流架构则是Native for AI，也就是为AI原生设计出的一种完整的计算架构，这里面从软件到硬件存在大量的创新机会。”理想汽车CTO、系统与计算群组负责人谢炎曾这样表示。

不同于上述冯·诺依曼架构的指令流驱动计算，理想选择的动态数据流架构则是数据流驱动计算，由数据就绪状态触发运算，数据在计算阵列中流式传递，传输与计算深度重叠，简言之大幅省掉了传统计算和储存之间的数据“搬运”时间。

带来的好处是明显的。按照理想在ISCA 2026发表的《M100: An Orchestrated Dataflow Architecture》论文显示，计算单元可连续工作，实现数据的高利用率，由于减缓了“内存墙”限制，数据可以在计算单元中高效流动，实现低延迟计算。

更重要的是，动态数据流路径可以随未来AI模型的迭代而随之更新，保证芯片计算效率的同时，具备持续迭代的能力，稳固其领先性。

马赫M100芯片在实际运行中能发挥出更大的性能优势。按照理想官方给出的数据，单颗芯片的有效算力约为英伟达Thor U的三倍，两颗并联运行时，数据处理效率可达到Thor U的五到六倍。

正因这样，在理想汽车之前，数据流架构很早就已成为学术界和产业界探索的技术路线。

2015年，Google推出了第一代基于类似数据流架构的芯片两年后，他们在ISCA 2017上发布论文《In-Datacenter Performance Analysis of a Tensor Processing Unit》，标志着数据流架构首次在工业界获得了大规模验证。

这之后，虽然有Groq、Graphcore、sambaNova以及鲲云科技等企业相继布局数据流架构，但并未涉足车规级芯片领域。随着马赫M100上车全新L9后，理想就此成为行业中首个把动态数据流架构应用至大算力车规级芯片的玩家。

但理想选择动态数据流架构的野心，并不止于车。

2、李想的终极野心——成为物理AI时代的“苹果”

“理想L9，是一辆真正懂你的、有生命力的车。”

这是李想对于全新理想L9系列的评价，在他看来这系列车已经拥有了具身智能的完整垂直整合技术栈——眼睛（感知）、大脑（模型）、心脏（芯片）和神经（操作系统）。

按照李想在社交媒体上的回顾，2021年5月自研感知系统随21款理想ONE量产上车；再到2023和2024年，理想自研的大模型MindGPT和操作系统星环OS相继量产上车。

随着马赫M100芯片的上车，理想正式补上了这套完整体系的最后一块拼图，从而推动实现李想口中的“让车从被动工具变成主动的伙伴”。

要完成这个转变，需要基于车端算力和计算单元效率的提升，随着马赫M100的动态数据流架构，能使每个计算单元根据数据到位情况自主执行任务，车端模型的处理能力能显著提升，随之带动整车系统的效率迭代。

从感知层看，可以实时处理来自摄像头、雷达和激光雷达的数据流，并通过3D ViT让这些感知数据更早得在编码阶段直接构建成3D空间表示，让模型更容易理解物理世界空间架构。

再到规划和决策层，数据流架构降低了模型推理延迟，系统可以更加快速和高效的响应和处理突发情况；最后在整车不同系统的协同上，数据交换更高效、算力利用率可大幅提升。

根据理想官方的数据来看，新一代L9搭载马赫M100芯片后，从摄像头、激光雷达等传感器采集数据，到模型处理和决策输出，再到车辆执行动作的端到端响应时间可缩短约200-300毫秒。

具体到智能辅助驾驶场景中，端到端延时下降40%，感知更快、预判更及时和执行更果断。落到用户层面上，应该就会体验到更安全、更智能和更舒适的智驾体验。

但在理想他们看来，马赫M100不只是一颗智驾芯片。

谢炎说的很明白：“马赫M100不是单纯的智驾芯片，而是一个通用的AI计算平台，它要支持的不仅是自动驾驶，还包括座舱AI交互、机器人运动控制以及未来可能的家庭智能体”。

会有这样的战略布局，或许是源于李想对于具身智能行业的判断——自动驾驶是具身智能的上半场，人形机器人是具身智能的下半场。

对于下半场，李想将其分为三个阶段：2030至2035年达到6岁儿童泛化能力；2035至2040年达到12岁水平；2040年至通用人工智能（AGI）实现前后达到18岁成人水平。

由此，理想目前在机器人领域已有布局，按照李想在播客节目中的介绍，已有两款机器人在布局，一款轮式机器人面向工厂与商业场景，另一款为人形机器人，聚焦硬件控制精度与耐久性。

除了车和机器人之外，在李想的设想中，希望下一代芯片能为家庭中提供算力，能够稳定的跑上百B的模型，从而来支持未来家庭中机器人或者其他智能体计算所需。

看完这些布局后，回过头再来看理想他们为何会选择动态数据流架构自研芯片，思路就更加清晰了，因为这颗芯片需要服务不同的物理AI在不同的场景中完成各种任务，因此可编程的动态数据流架构就比固定的ASIC更能适应多场景需求。

放眼智能汽车行业，自研芯片的玩家除了理想，还有特斯拉、小鹏等玩家，其中小鹏的图灵AI芯片已经向行业供给。

今年3月，大众安徽与众08正式投产，该车型在智能辅助驾驶上，标配搭载了小鹏的图灵AI芯片和第二代VLA系统，据飞说智行了解，这款车之后大众和小鹏联合开发的新车型也将在今年推向市场。

对于理想来说，向外供给芯片的野心大概率也有，毕竟对外授权不仅能带来收入，还能加速编译器、软件栈等软硬工具链的成熟。

只不过李想还有更大的野心，他曾在个人微博中表示“他们希望把AI带进物理世界，并给大家像苹果一样的体验。”从上述可知，理想目前已经自研了芯片、操作系统和模型等软硬一体系统化能力。

只不过理想要走好这条路，才刚刚开始。

3、英伟达走过的路，理想也要重走一遍？

虽然英伟达CEO黄仁勋一直不愿公开承认，但CUDA生态确实已成为英伟达最深的“护城河”。

2005年，在见证3dfx等芯片企业由于深陷技术专利诉讼拖垮现金流而倒下后，为了不重蹈这些企业的覆辙，黄仁勋在当年决定开发CUDA生态。这意味着，英伟达得建立一套完整的编译器、并行计算架构、驱动层和数学库（cuBLAS、cuDNN）。

从CUDA发布到真正被AI行业所关注到，英伟达等了6年，“这6年里，我们就像一直对着一堵墙说话，没有人理解我们在做什么。”黄仁勋在《黄仁勋：英伟达之芯》一书中这样回忆道。

但如今，CUDA生态中已有超过500万开发者、600个AI大模型、300个软件库以及3700多个应用程序。由于行业主流AI算法框架都支持CUDA生态，算法工程师几乎可以零成本地把模型部署到英伟达GPU上。

想要成为物理AI时代“苹果”的理想，或许也得走一遍英伟达曾走过的路。

不同的模型和算法，要在采用动态数据流架构的马赫M100芯片上跑，都需要经过编译器的转译来适配数据流架构，并且要根据芯片硬件拓扑来优化数据流计算路径。

由此在业内看来，理想有可能需要像当年的英伟达一样，构建自身的“马赫CUDA”生态。但在飞说智行看来，要做到这个目标，理想应该比英伟达相对容易一些。

相比CUDA发布后，英伟达苦苦寻找客户不同，理想马赫M100芯片最大的客户，就是理想自己。全新理想L9全系均搭载马赫M100芯片，根据车fans统计数据看，将近90%的用户都选了Livis版本，而按照理想公布的最新消息，Livis版本上市前两周大定订单破万。

“马赫M100能在全新理想L9上车，就意味着芯片和算法的软硬适配已经完成了，未来随着整车业务发展就能反哺芯片业务，这是像英伟达这样的传统芯片公司早期发展阶段很难做到的。”《中国芯片往事》作者，芯片行业分析师杨健楷对飞说智行这样说道。

这背后得益于理想内部芯片、算法和智驾三方团队的深度融合协作。按照李想在播客节目中透露，从2022年马赫芯片项目立项之初，这三个部门的团队就实现了“同桌办公”，共同来定义和设计芯片架构。

理想的智能辅助驾驶能力能从前些年的跟随，到这两年稳稳站在行业第一梯队中，同样依靠像这样芯片、算法和智驾三方团队的内部深度协作来实现的。

除了有整车业务支撑之外，理想的资金能力同样能支持芯片业务日后的发展。

根据这两天理想刚发布的今年一季度财报来看，当季销量累计交付9.51万辆，位居20万元以上新能源汽车市场中国品牌销量第一。基于销量表现，今年一季度理想实现营收230亿元，处于造车新势力前列水平。

值得注意的是，截至一季度末，理想汽车现金储备为943亿元，已连续10个季度保持千亿左右的资金规模。有这样健康的现金储备表现，支撑理想芯片业务发展不成问题。

在杨健楷看来，随着理想跑通马赫M100芯片的大规模量产交付，并验证基于该芯片的智能辅助驾驶能力和用户体验能达到行业领先水平后，未来应该会有其他玩家跟进布局动态数据流架构。

北京车展前夕，谢炎在媒体访谈中表示“（当时）现在马赫M100的业务目标达成度只有60%”，目前搭载马赫M100的全新理想L9已经上市，对他来说业务目标达成度应该上涨了一些，但肯定没达到完全达成的水平。

毕竟在谢炎看来，真正的成功，是搭载马赫M100的L9智驾能力跑到业界第一，然后车又卖得很好，那样他们才能非常有底气地说达到业务目标。

而到那天，飞说智行相信“摸着理想过河”的桥段会再次上演。

特别声明：本文为合作媒体授权DoNews专栏转载，文章版权归原作者及原出处所有。文章系作者个人观点，不代表DoNews专栏的立场，转载请联系原作者及原出处获取授权。(有任何疑问都请联系idonews@donews.com)