王兴兴对VLA模型发出质疑：机器人数据被过分关注了- DoNews

DoNews8月11日消息，据42号电波报道，8 月 9 日，宇树科技创始人兼 CEO、CTO 王兴兴在 2025 世界机器人大会上发表演讲，演讲中，王兴兴接连抛出炸裂观点，包括自己对于时下热门的 VLA 模型的看法。

王兴兴认为，在政策和市场需求的不断促进下，人形机器人整机与零部件厂商平均实现了 50%-100% 的大幅增长。并且人形机器人行业已经走到「ChatGPT 时刻」的前夜，最快 1-2 年就能迎来这一时刻。

但王兴兴表示，行业发展仍然存在几大误区，主要包括以下几个方面。

具身智能完全跟不上

王兴兴认为，机器人目前没有大规模应用的原因，不是因为硬件不行。目前的机器人硬件，不管是整机还是灵巧手，完全是够用的。

现在最大的问题在于具身智能的发展完全跟不上，这是限制当前机器人，尤其是人形机器人大规模的应用的关键。

不过现在整个行业处于 ChatGPT 诞生前的 1-3 年左右，业界已经发现了类似的方向以及技术路线，但是没人把它做出来。

在机器人 AI 技术上，他认为临界点应该是：当人形机器人能够做到进入完全陌生的环境后，可以顺畅自主地完成类似「把这瓶水带给某位观众，或是整理一下这个房间」的指令任务时，那就真正迎来了人形机器人的 ChatGPT 时刻。

对此王兴兴表示，如果进展顺利，未来的 1-2 年或者 2-3 年就能实现这一目标，最慢的话 3-5 年也有很大概率可以实现。

数据被过分关注，对 VLA 保持怀疑

在整个机器人行业多数团队都在为数据发愁的情况下，王兴兴表示，机器人数据被过分关注了，现在最大的问题是模型，并不是数据问题。对于具身智能和机器人来说，模型架构都还不够好，也不够统一。

很多团队认为只要有了足够多和足够好的数据，就可以把模型训练的越来越好，实则不然，一些情况下即便有了数据，数据也是用不起来的。

所以，王兴兴表示：「我个人对 VLA 模型还是保持一个比较怀疑的态度。」

他认为，现在的 VLA 模型是一个相对比较傻瓜式的架构，在和真实世界交互时，它的数据质量、能采集的数据是不太够用的。宇树在尝试 VLA 模型加 RL 训练后，还是不够，所以，模型架构需要再升级和优化。