对话智源研究院院长王仲远:AI加速从数字世界迈向物理世界

2025年智源大会上,人形机器人成为焦点。智源研究院院长王仲远表示,人工智能正加速从数字世界走向物理世界,致力于解决实际生产生活问题。

王仲远认为,大语言模型性能提升逐渐遇到瓶颈,未来发展方向将从单一的大语言模型转向多模态尤其是原生多模态世界模型。这些模型能够感知和理解物理世界,从而推动与物理世界的交互。

在技术路线方面,智源研究院推出“悟界”系列大模型,包括原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、跨本体具身大小脑协作框架RoboOS 2.0与具身大脑RoboBrain 2.0以及全原子微观生命模型OpenComplex2。

关于“世界模型”的核心定义,王仲远以咖啡杯为例指出,现有模型仅能描述静态信息,而无法预测动态变化。Emu3的核心突破在于建立对物理因果关系的理解,而非简单拼接多模态信息。

对于具身智能的落地路径,王仲远持务实态度。他肯定了人形机器人的长期价值,但短期内四足、轮式等形态将共存。人形机器人成熟周期较长,现阶段稳定性仍需提升。

针对数据悖论问题,王仲远提出通过互联网视频数据训练基础能力,再以少量真实数据强化学习微调的方法。工厂场景因其封闭性和重复任务特点,成为具身智能首个突破口。

关于“大小脑融合”概念,王仲远表示,当前数据量不足以支持该模型训练,未来5-10年可能实现。具身智能目前泛化性不足,需逐步发展到具备跨领域泛化能力。

MCP、Agent成为人工智能领域热点话题。王仲远认为,当基础大模型达到可用状态后,Agent可成为产业界发力方向,类似于移动互联网APP的发展趋势。

王仲远指出,“百模大战”已收敛至少数玩家,未来可能出现基于基础大模型衍生出的垂类模型竞争。具身大模型发展仍处于早期阶段,面临技术路线分歧和产业落地挑战。

王仲远总结,当机器人能够真正理解物理世界的因果关系时,将是物理AGI的重要里程碑。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1