智元机器人推出行业首个面向真实世界机器人操控的统一世界模型开源平台 Genie Envisioner(GE),整合未来帧预测、策略学习与仿真评估。
该平台采用以视频生成为核心的闭环架构,使机器人能在同一模型中完成从 “看” 到 “想” 再到 “动” 的端到端推理与执行。基于 3000 小时真机数据训练,GE-Act 组件在跨平台泛化和长时序任务执行方面表现优于现有顶尖水平,例如仅需 1 小时遥操作数据即可适配新机器人平台,折叠纸盒任务成功率达 76%。
Genie Envisioner 包含 GE-Base(多视角视频世界基础模型)、GE-Act(平行流匹配动作模型)和 GE-Sim(层次化动作条件仿真器)三大核心组件,并配套提供 EWMBench 评测套件。开发团队已开源平台全部代码、预训练模型及评测工具,未来计划扩展支持更多传感器模态,推动智能制造与服务机器人领域的发展。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。