跨越1700公里!当虹科技“隔空”指挥机器狗探火山 直击机器人远程操控痛点

在我们的印象中,机器人只能完成一些简单的指令。如果想要机器人完成复杂动作,就必须拿着遥控器近距离操控。这几乎已经是业内面临的共同挑战。

但在当虹科技9月19日举办的企业战略重大升级暨BlackEye2.0多模态空间大模型新品发布会上,这一固有认知被打破——工作人员仅凭一部手机,就成功操控1700公里以外的机器狗爬火山,让“决胜于千里之外”的操控成为现实。

值得一提的是,工作人员通过机器狗获取的不仅是视频信息,还有文本、图片、音频、三维点云。这五个模态的融合应用,使千里之外的操控如临现场。

超低延时传输 千里之外操控如临现场

一边是位于内蒙古乌兰察布的乌兰哈达6号火山,地形地貌复杂,网络不稳定;另一边是位于杭州滨江的当虹大厦,现场数十家媒体、百余位嘉宾共同见证,观察机器狗的动作,是否与操控指令完全一致。

起立、右转、越障……随着操作人员发出指令,千里之外的机器狗在火山碎石坡上几乎实时响应,甚至吸引许多游客上前围观互动。

“想要实时操控千里之外的机器狗,首先必须解决延时问题。”当虹科技副总裁吴奕刚在发布会上表示,当虹科技BlackEye Vision机器人超远距离远程控制系统,把端到端的延时控制在80毫秒以内,比人类神经反应极限(100毫秒)还缩短20毫秒,所以操控起来和现场一样丝滑。

据了解,以往我们所看到的机器人只能在视距内近距离操控,主要通过自组网图传系统实现。而当虹科技发布的BlackEye Vision系统通过4G/5G公网上云,实现视频超低延时实时传输并实时操控,大大缓解带宽不足带来的限制。

弱网也能远控 断网时可充当移动基站”

吴奕刚表示,跨越千里的远程操控对机器人的感知能力和信息传输能力也提出了巨大挑战。操控人员必须根据机器狗实时回传的信息(例如视频、图片、雷达点云)来判断现场情况,从而进行正确操控。

然而,乌兰哈达6号火山附近属于弱网环境,只能勉强连上4G网络,有时甚至只能切换为卫星通信。要把现场复杂的环境信息(例如较大的玄武岩石块、火山渣等堆积物)传回给操控人员,主要依托于BlackEye多模态空间大模型的压缩能力。先将高清视频流进行10-100倍的超级压缩,再通过AI画质增强算法,确保在低带宽环境下也有高清视野。

值得一提的是,BlackEye Vision还具备强大的多模态处理能力——视频、音频、雷达点云、控制信令、文本信息都能同步传输。这意味着,操控人员不仅能看到高清影像,还能通过三维空间数据感知地形起伏、障碍物距离,获得接近真实的临场感。尤其是遇到烟尘、雾气等可见光视频识别困难时,雷达点云数据就可以派上大用场。

吴奕刚还表示,机器人超远距离远程操控系统在地震、特殊作业等断网环境中也能发挥重要作用。这些场景,往往已经断网、断路、断电,我们所熟知的4G、5G和Wi-Fi已无法提供实时通信。此时,搭载便携式卫星通信终端的机器人,作为一个临时的“移动基站”,可以把现场无人机组成的“蜂群”与机器狼组成的“狼群”获取到的信息传回指挥中心。

远程操控积累训练数据具身智能的必经之路

我们对机器人的期待,并不是从事写诗、作画等文艺创作,而是协助人类从事繁重、危险的工作,例如危险采矿、灾难救援、核反应堆维护等。科技部近日表示,正在推动人形机器人在汽车制造、物流搬运、电力巡检等场景加速落地应用。

但是想要实现机器人自主去完成这些任务,除了算法和算力,目前对复杂环境的操作数据非常稀缺。类似于拿饮料、做咖啡、下棋等日常动作,可以通过设定指令和日常获取数据来完成。但如果需要人们亲历火山、地震等特殊环境的现场获取这些数据,无论是危险程度还是成本都难以承受。

吴奕刚表示,通过远程操控的方式使机器人在复杂的环境中执行任务,其实是一边完成真实任务,一边积累高价值操作数据,为后续的模仿学习与离线强化学习提供“燃料”。

现场业内人士表示,远程操控是机器人走向具身智能的必由之路。未来,机器人很可能呈现“具身智能+远程操控”的融合形态。而在具身智能真正到来的时候,远程操控也将在具身机器人“失灵”的时候起到“接管”的兜底作用。

声明:本站转载此文目的在于传递更多信息,并不代表赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。
最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1