Meta公司近日推出了最新人工智能模型V-JEPA 2,作为去年V-JEPA的扩展版本,该模型通过超过100万小时的视频素材训练,旨在帮助AI智能体更好地理解并预测物理世界的动态。例如,机器人能够根据场景预测下一步动作,如将煮好的鸡蛋用锅铲移到盘中。这种能力类似于儿童和动物通过经验形成的常识性联系。
V-JEPA 2的运行速度比Nvidia的Cosmos模型快30倍,尽管两者可能采用不同基准评估性能。Meta首席人工智能科学家Yann LeCun表示,世界模型有望开启机器人技术的新篇章,使AI在无需大量机器人训练数据的情况下,高效协助人类完成日常任务。这一进展或将显著提升AI在实际生活中的应用潜力。