智元机器人开源通用具身基座大模型GO-1

智元机器人宣布,通用具身基座大模型GO-1(Genie Operator-1)已在GitHub正式开源,成为全球首个采用Vision-Language-Latent-Action(ViLLA)架构的通用具身智能模型。这一突破性架构通过引入隐式动作标记,有效弥合了图像-文本输入与机器人动作执行之间的语义鸿沟,显著提升了机器人对复杂任务的理解与执行能力。

该模型基于多模态理解、隐式规划和动作生成三层协同设计,支持多视角视觉、力觉信号与语言指令的融合处理。同时,智元推出Genie Studio一站式开发平台,覆盖数据采集、模型训练到真机部署全流程,助力开发者快速实现具身智能应用落地。GO-1已在多类机器人本体上完成验证,展现出优秀的可移植性与仿真性能。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1