谷歌推Gemini Robotics新模型实现机器人先思考后行动- DoNews

DoNews > 公司新闻 > 谷歌推Gemini Robotics新模型实现机器人先思考后行动

谷歌推Gemini Robotics新模型实现机器人先思考后行动

推荐 2025-09-26 16:34:03

谷歌 DeepMind 团队于9月25日发布Gemini Robotics 1.5与Gemini Robotics-ER 1.5两款专为物理世界设计的AI模型，旨在构建具备感知、规划、思考与行动能力的物理智能体。

这两款模型采用“大脑-身体”协作框架，协同解决现实世界中的复杂多步任务。其中，Gemini Robotics-ER 1.5作为“高层大脑”，负责环境理解、规划与决策，具备领先的空间认知能力。

例如，在执行垃圾分类任务时，ER 1.5可主动搜索本地分类规则，并生成详细行动计划，再将自然语言指令传递给Gemini Robotics 1.5。

Gemini Robotics 1.5作为“身体”角色，是一个视觉-语言-行动（VLA）模型，能将高层指令转化为具体机器人动作。

该模型具备“先思考后行动”的能力，在执行前通过自然语言进行内部推理。例如在衣物分类任务中，会先形成“白色衣物入白桶，其他入黑桶”的逻辑判断，再规划具体操作步骤，提升任务成功率与行为可解释性。

新模型展现出跨机器人形态的学习迁移能力，能将在ALOHA 2机器人上学到的技能，直接应用于Apollo人形机器人和Franka双臂机器人等结构不同的平台，无需额外训练。

谷歌表示，Gemini Robotics 1.5集成整体安全策略，包括行动前安全评估、遵守预设政策及触发机器人内置低级安全系统，以确保具身AI的安全与对齐。

Gemini Robotics-ER 1.5已通过Gemini API向开发者开放，Gemini Robotics 1.5目前仅供部分合作伙伴使用。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

东昇聚变完成新一轮1亿美元融资，启明创投联合领投东昇聚变完成1亿美元融资，推进氘-氦3紧凑型聚变装置研发，具低辐射、低成本优势，拟与氘-氚路线协同发展。

东风股份携手九识智能，Zelos Inside深度赋能东风OpenVAN全系无人车全球首发东风股份与九识智能联合发布全球首个主机厂城市无人货运车品牌OpenVAN及四款产品，搭载L4级智驾系统，覆盖全场景城市物流。

Anthropic被曝雇1000名人类工程师训练Claude Code Anthropic联合Snorkel AI开展“Marlin”项目，由千名工程师外包人员通过A/B测试微调Claude Code，提升其生成简洁、易维护代码的能力。

消息称SpaceX IPO将禁止中国投资者参与 SpaceX IPO禁止中国内地和香港投资者参与，因ITAR等出口管制合规风险；计划融资750亿美元，估值1.75万亿美元。

百度 MEG 组织架构调整：数字人创新业务部升级独立部门百度MEG重组，成立大商业事业部；数字人品牌升级为“百度一镜”，打造全场景数字人平台，李彦宏称其为AI时代通用交互界面。

云知声发布U2大模型，可自主拆解并完成100+步复杂真实工作流云知声发布U2大模型，主打高智能密度与高Token价值，具备强推理、编程及Agent能力，支持百步以上复杂任务闭环执行。

两部门联合印发《网络测评活动规范》：推销并附加购物链接应显著标明“广告” 国家网信办、市场监管总局联合出台《网络测评活动规范》，明确测评需客观公正、委托资质机构测试、禁止商测一体，强化平台责任与监管执法。

传淘宝闪购加大零售业务投入：发展便利店及前置仓等淘宝闪购2027财年目标：外卖单月UE转正；零售日均单量达2000万，淘宝便利店扩至3000家；投入减半但亏损收窄。

关于我们| 电子协议| 合作联系| 京ICP备2025120072号

网站信息

Copyright © DoNews 2000-2026 All Rights Reserved
京ICP备2025120072号
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2026 All Rights Reserved
京ICP备2025120072号

京公网安备11010802023059号