字节跳动 Seed 推出 GR-RL，机器人首次完成真机穿鞋带- DoNews快讯

DoNews > 快讯 > 字节跳动 Seed 推出 GR-RL，机器人首次完成真机穿鞋带

字节跳动 Seed 推出 GR-RL，机器人首次完成真机穿鞋带

2025-12-03 09:57:03

430741

字节跳动 Seed Research 团队正式发布最新研究成果 GR-RL，在真实机器人平台上首次实现了「连续为整只鞋穿鞋带」的复杂操作。字节跳动称，这一突破标志着视觉-语言-动作（VLA）模型在精细灵巧任务上的能力边界被显著拓展。

团队指出，主流模仿学习存在两大缺陷：人类演示数据的「次优性」以及训练与推理之间的「执行错位」，导致模型在毫米级精度任务中频繁失败。

为此，Seed 团队选择真机强化学习路径，提出了多阶段训练框架，包括离线数据筛选、数据增强以及在线强化学习。在双臂机器人 ByteMini-v2 上，GR-RL 将穿鞋带任务成功率从监督学习基线 GR-3 的 45.7% 提升至 83.3%，失败率减少近 70%。

其中，数据过滤、镜像增强和在线强化学习均对性能提升贡献显著。实验中，模型展现出类似人类的「纠错智能」，在鞋带滑落或摆放位置不佳时能主动调整并重试，体现了对任务物理逻辑的理解，而非单纯轨迹记忆。团队认为，强化学习经验应进一步蒸馏回基础 VLA 模型，以构建兼具高精度操作与强大泛化能力的通用策略。

抖音集团真人短剧最新政策解读：如何利好B级剧？为好点子和创造力买单。

中国新能源车为什么越造越沉新能源汽车不能再胖下去了

消息称无人环卫仙途智能“崩盘”：上百人离职仙途智能自2025年起爆发大规模欠薪，3个月减员120人，多部门核心负责人离职，组织架构与工商信息频繁变更，员工维权后难获执行。

梦想4周年岚图梦想家推出2.3万元限时购车权益岚图梦想家上市4周年推限时权益：2026款享2.3万元补贴及3年0息；冠军版6000元升舱含15项豪华配置，主打安全、智能与舒适。

粉笔CEO张小龙在人大讲座辱骂学生：你们找不到工作是应该的粉笔CEO张小龙在中国人民大学哲学院讲座中发表贬损学生言论，引发争议；原定考公主题被临时改为AI职业规划，因现场冷场致其言辞升级。

赛豆科技全新汽车品牌将于6月9日发布赛豆科技将于6月9日发布全新AI汽车品牌，定位年轻运动市场，由赛力斯与字节跳动火山引擎合作打造，推纯电+增程双动力车型。

SpaceX 敲定 IPO 发行价：每股 135 美元 SpaceX拟IPO，发行价135美元/股，融资750亿美元，马斯克持股超82%投票权；xAI向特斯拉采购储能设备达2.69亿美元。

豆包将推专业版；SpaceX 敲定 IPO 发行价；DeepSeek 首轮融资拟筹集 500 亿元｜Do早报 Hello，大家早上好，又是元气满满的一天，先来浏览新鲜的早报吧～

关于我们| 电子协议| 合作联系| 京ICP备2025120072号

网站信息

Copyright © DoNews 2000-2026 All Rights Reserved
京ICP备2025120072号
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2026 All Rights Reserved
京ICP备2025120072号

京公网安备11010802023059号