智驾行业聚焦世界模型:云端仿真验证核心工具

过去两三年,世界模型成为智能驾驶领域最热门技术概念,小鹏、蔚来、华为、理想、地平线、元戎启行、Momenta等企业均宣布布局。小鹏称其为“世界基座模型”,蔚来称“端到端世界模型”,华为命名为“世界行为模型”(WA)。尽管名称各异,业内普遍认为当前智驾所指世界模型在技术路径上并无本质差异,实为对传统仿真工具的技术范式升级,目标是在还原度更高、颗粒度更细、场景更丰富、自由度更大的虚拟环境中,支撑端到端智驾模型的测试与验证。

世界模型并非构建完整数字物理世界,而是以该思路打造高阶仿真器。目前所有已知应用均限于云端,尚未部署至车端。其核心功能包括对物理世界的数字化建模与抽象,以及基于建模生成合理想象与预测,例如依据输入图像推演未来场景演化。模型优劣取决于云端生成数据的真实性与多样性;若仅回放真实采集数据,则不构成真正世界模型。

端到端架构普及凸显传统仿真器短板。规则时代仿真器主要承担两类任务:复现路测中发生的接管事件;通过脚本预设典型corner case(如横穿行人、加塞车辆)扩充数据。此时仿真器扮演“放大镜”角色。而端到端模型难以分段验证,导致系统性生成可控corner case、支撑大规模闭环验证的能力严重不足,世界模型由此被引入作为新一代验证与反证系统。

世界模型在工程中定位为智驾模型的“教练”,用于云端重放、改写、扩增现实驾驶情境,检验车端大模型输出的稳定性与可复现性,并将错误归因转化为可追踪证据链。国内车企主流采用3D高斯重建等路径,相较特斯拉“世界模拟器”存在一定差距,但业内人士估计差距不足一年。特斯拉未使用“世界模型”一词,其模拟器基于海量自建数据训练,通过神经网络拟合世界动态,减少显式物理规则堆叠,强调概率权重与组合空间,以提升泛化能力。

世界模型训练数据质量直接影响生成质量。极佳视界产品线负责人毛继明指出,若输入数据质量为60分,生成数据质量可能仅55分。供应商研发人员称,基于世界模型可按指令生成视频训练数据,效率远高于真实采集再训练,模型迭代速度有望实现断代式领先。但当前实际能力距理想状态仍有显著差距。

行业整体处于初期阶段。国内厂商基于世界模型最长可生成30–60秒视频片段,但动态物体在时空一致性与多视角一致性方面表现不佳。生成式模型固有“幻觉”风险使世界模型面临真实性挑战:若生成非现实行为(如车辆横行),将导致车端模型学习错误因果关系,引发误判。仿真器若无法逼近湿滑路面制动距离、逆光静止物体误检、并线博弈策略等关键因果关系,所生成corner case即为虚假问题,研发资源将被浪费于幻影优化。

算法层面尚未突破被视为最大瓶颈。前理想汽车端到端模型负责人夏中谱认同Yann LeCun观点:图像模型缺乏类似语言模型的高效自监督训练范式。语言信息密度高、语义约束明确;而图像中与驾驶决策相关有效信号占比极低——百万像素中或仅20余像素关键,其余均为噪声。当前智驾算法尚不能稳定提取足够决策价值的图像信息,更遑论组织成推理结构。因此,世界模型仍属研究性质投入,多数车企对其技术理解尚浅,用户体感不明显源于其仅处于“训练验证”第一阶段,未进入“支撑决策规划”第二阶段。端侧部署世界模型被公认为最难环节,目前无任何企业实现。夏中谱指出,唯有当世界模型能通过与物理世界交互预测演化并主动决策影响世界时,自动驾驶与机器人问题方可根本解决。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1