王兴兴对VLA模型发出质疑:机器人数据被过分关注了

DoNews8月11日消息,据42号电波报道,8 月 9 日,宇树科技创始人兼 CEO、CTO 王兴兴在 2025 世界机器人大会上发表演讲,演讲中,王兴兴接连抛出炸裂观点,包括自己对于时下热门的 VLA 模型的看法。

王兴兴认为,在政策和市场需求的不断促进下,人形机器人整机与零部件厂商平均实现了 50%-100% 的大幅增长。并且人形机器人行业已经走到「ChatGPT 时刻」的前夜,最快 1-2 年就能迎来这一时刻。

但王兴兴表示,行业发展仍然存在几大误区,主要包括以下几个方面。

具身智能完全跟不上

王兴兴认为,机器人目前没有大规模应用的原因,不是因为硬件不行。目前的机器人硬件,不管是整机还是灵巧手,完全是够用的。

现在最大的问题在于具身智能的发展完全跟不上,这是限制当前机器人,尤其是人形机器人大规模的应用的关键。

不过现在整个行业处于 ChatGPT 诞生前的 1-3 年左右,业界已经发现了类似的方向以及技术路线,但是没人把它做出来。

在机器人 AI 技术上,他认为临界点应该是:当人形机器人能够做到进入完全陌生的环境后,可以顺畅自主地完成类似「把这瓶水带给某位观众,或是整理一下这个房间」的指令任务时,那就真正迎来了人形机器人的 ChatGPT 时刻。

对此王兴兴表示,如果进展顺利,未来的 1-2 年或者 2-3 年就能实现这一目标,最慢的话 3-5 年也有很大概率可以实现。

数据被过分关注,对 VLA 保持怀疑

在整个机器人行业多数团队都在为数据发愁的情况下,王兴兴表示,机器人数据被过分关注了,现在最大的问题是模型,并不是数据问题。对于具身智能和机器人来说,模型架构都还不够好,也不够统一。

很多团队认为只要有了足够多和足够好的数据,就可以把模型训练的越来越好,实则不然,一些情况下即便有了数据,数据也是用不起来的。

所以,王兴兴表示:「我个人对 VLA 模型还是保持一个比较怀疑的态度。」

他认为,现在的 VLA 模型是一个相对比较傻瓜式的架构,在和真实世界交互时,它的数据质量、能采集的数据是不太够用的。宇树在尝试 VLA 模型加 RL 训练后,还是不够,所以,模型架构需要再升级和优化。

王兴兴对VLA模型发出质疑:机器人数据被过分关注了
扫描二维码查看原文
分享自DoNews
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1