UC伯克利给四足机器人加Buff:瞬间适应各种真实地形,抹了油的地面也能hold住

让它们在各种地形上行走平稳没有你想象的那么容易。

随着四足机器人的应用越来越成功,它们面对的场景也会越来越多

今天爬楼梯,明天过草地,后天又去坑坑洼洼的石子地……

这么复杂多变的地形它们可hold不住,分分钟给你表演个人仰马翻

UC伯克利给四足机器人加Buff:瞬间适应各种真实地面

不过现在,来自UC伯克利、卡内基梅隆大学以及Facebook AI的研究人员发明了一种新算法:

不需要任何参考轨迹无需微调直接部署在机器人身上——

就能让它们在瞬间适应各种复杂的新地形,一步都不带“走神”地穿过乱石、沙滩、楼梯、长植被、人为搭建的活动板等环境。

UC伯克利给四足机器人加Buff:瞬间适应各种真实地面
UC伯克利给四足机器人加Buff:瞬间适应各种真实地面
UC伯克利给四足机器人加Buff:瞬间适应各种真实地面
UC伯克利给四足机器人加Buff:瞬间适应各种真实地面

滴了油的垫子上也是健步如飞、突然被负重5公斤也没事!

UC伯克利给四足机器人加Buff:瞬间适应各种真实地面

这个对于人类来说非常简单的技能,机器人现在也拥有了……

就问你厉不厉害(怕不怕)?

ps.眼尖的朋友应该能看出来,这个项目用的机器人就是咱国产的A1,来自杭州的Unitree。

如何做到的?

这个算法被命名为RMA(Rapid Motor Adaptation,快速电机自适应)。

由两部分组成:基本策略模块 (base policy, π)和自适应模块 (adaptation module, ϕ)。

UC伯克利给四足机器人加Buff:瞬间适应各种真实地面

算法完全在仿真环境中训练,然后直接部署于现实世界

训练分为两个阶段。

第一阶段,将机器人当前状态、先前的动作、环境因素作为输入,使用model-free的强化学习进行基本策略训练。

第二阶段,采用on-policy数据的监督学习,训练自适应模块通过历史状态和动作来预测外部参数(extrinsics),也就是该怎么下脚。

部署阶段,自适应模块生成外部参数,基本策略模块生成所需的关节位置,并使用A1机器人的PD控制器转换为扭矩。

总的来说,基本策略模块探测环境,并实际控制机器人的步态

自适应模块负责分析基本策略给的数据,并加以分析,然后告诉基本模块如何调整步态。

两者协同工作以便在多样化的环境中实现实时适应。

需要注意的是,该算法没有视觉输入!环境因素由机器人运动部件“感觉到”的力收集而来。

室内和室外测试

又到了评估性能的时刻,室内测试中,将三者:RMA、A1机器人本身的控制器、没有自适应模块的RMA进行了比较。

结果发现,RMA以100%的成功率走下15cm高度的台阶,并以80%的成功率走过可变形表面(记忆泡沫床垫和微微不平整的泡沫垫)。

UC伯克利给四足机器人加Buff:瞬间适应各种真实地面

它也能够成功爬上斜坡和台阶。

在油性表面上行走的成功为90%。

UC伯克利给四足机器人加Buff:瞬间适应各种真实地面

而A1的控制器在不平整的泡沫上就只有20%的成功率。

UC伯克利给四足机器人加Buff:瞬间适应各种真实地面

没有自适应模块的RMA就基本啥也不行了。

最下面的三张图表还说明了三种方法的有效载荷限制

A1控制器的性能在8Kg载荷下开始下降。

没有自适应模块的RMA承载超过8Kg后就没法移动,不过倒是不会跌倒。

而RMA则在负重、保持平衡与行走距离上碾压前两者。

A1机器人的本身重量为12Kg。

UC伯克利给四足机器人加Buff:瞬间适应各种真实地面

而在室外:RMA在沙子、泥堆、高大植被上行走或穿越灌木的成功率为100%(不会被草缠脚)。

UC伯克利给四足机器人加Buff:瞬间适应各种真实地面
UC伯克利给四足机器人加Buff:瞬间适应各种真实地面

而在乱石堆上行走时成功率为80%。

在铺满了枯枝败叶的自然阶梯上的成功率为70%。

最后,研究人员表示,要开发出真正可靠的地形自适应机器人,现在的这个“盲人”机器人的装备还远远不够,还需配上视觉传感器等工具。这也是他们未来工作的一个重要方向。

论文地址:
https://arxiv.org/abs/2107.04034

看大量实验效果请戳:

https://ashish-kmr.github.io/rma-legged-robots/

版权所有,未经授权不得以任何形式转载及使用,违者必究。