英伟达与字节跳动在具身智能领域同步推进,分别从硬件与模型层面布局“机器人大脑”。
2025年3月,英伟达CEO黄仁勋在GTC主题演讲中演示挪威1X公司NEO Gamma人形机器人,该机器人基于英伟达GR00T N1模型构建后训练策略,可执行自主整理任务。
黄仁勋强调人形机器人的关键在于适应性与学习能力。此后,英伟达于8月推出Jetson AGX Thor边缘计算平台,峰值算力达2070 FP4 TFLOPS,AI性能较Orin提升7.5倍,能效提升3.5倍。
Thor可在单一模块上实现多生成式AI模型运行,支持实时感知与决策,已被亚马逊仓储机器人、波士顿动力等企业集成应用。
Thor基于Blackwell GPU架构,绑定Isaac机器人软件平台、AI模型库与仿真工具,集成开源预训练模型Isaac GR00T N1,后者采用双系统架构:快速思考行动模型模拟人类直觉,慢思考模型负责环境推理与行动规划。
1X公司CEO Bernt Børnich表示,GR00T N1显著提升了NEO Gamma的推理能力,仅用少量后训练数据即完成部署。
Thor售价3499美元,功耗较高,主要适用于自动驾驶、工厂及送货机器人等场景。目前英特尔、高通等对手尚无同类集成产品。
与此同时,字节跳动Seed团队于7月发布通用机器人模型GR-3,并在官方视频中展示其控制ByteMini机器人完成衣架插入衬衫并挂起、拾取家居用品等复杂任务。
GR-3可理解“较大的盘子”“左边的椅子”等抽象语言指令,具备少样本适配能力,通过图像文本预训练、虚拟现实微调及现实动作模仿三阶段训练获得环境适应性。
据Chris Paxton研究披露,字节40亿参数GR-3表现优于英伟达约20亿参数的GR00T系列,验证“规模定律”有效性。
GR-3被视作机器人肢体的“神经元”,侧重执行层面。9月,字节发布Robix,负责任务规划、推理与自然语言交互,构成“统一机器人大脑”。
Seed研究员董恒称Robix性能优于GPT-4o和Gemini 2.5 Pro。技术文档显示,Robix需与VLA模型如GR-3配合使用,由后者完成身体动作执行。
Robix与GR-3协同工作模式与GR00T N1双系统架构相似。测试中,搭载GR-3的Robix在餐桌清理、收银装袋任务中得分最高,仅饮料筛选略逊于Gemini 2.5 Pro。
字节此前已推出GR-1、GR-2模型。GR-1为早期技术验证产品,采用视频预训练加机器人数据微调模式;GR-2使用3800万段视频、超500亿token数据预训练,在百项操控任务中平均成功率97.7%。
字节机器人探索始于2020年,张一鸣曾参与项目讨论。截至2025年,公司已量产超1000台轮式物流机器人,用于抖音电商仓及顺丰、比亚迪等客户产线运输。
这些机器人具备自主学习、路线规划与移动能力,聚焦仓储自动搬运方案。近期字节招聘多个“下一代通用机器人”岗位,均归属Seed团队,分布在北京与上海。
南华早报报道,Seed团队2025年人数预计超300人。字节还通过锦秋基金投资具身智能企业宇树科技,后者估值超百亿,获阿里、腾讯系资本支持。
锦秋基金由原字节财务投资人杨洁创立,核心成员来自字节投资体系,“锦秋”源自张一鸣创业地北京锦秋家园。
目前字节技术积累集中于模型侧,而英伟达提供硬件方案,二者形成潜在互补。字节长期为英伟达中国重要客户,黄仁勋多次强调中国市场在机器人发展中的关键地位。
2025年1月CES展会上,黄仁勋携14家人形机器人公司亮相,其中6家来自中国,包括宇树科技与小鹏。
英伟达官网显示,联影医疗、万集科技、优必选、银河通用、宇树科技、众擎机器人、智元机器人已采用Thor平台,但暂未列入字节。
宇树科技CEO王兴兴评价,Jetson Thor带来计算飞跃,提升机器人敏捷性、决策速度与自主水平,对现实世界导航与交互至关重要。
字节同步推出测试机器人ByteMini,具备22个自由度,手腕采用球形设计,适应狭小空间高灵巧操作任务,体现其打造具身智能产品的战略意图。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。