增量方向校正的学习

作者: | Wanxin Jin | Todd D. Murphey | Shaoshuai Mou |

摘要:本文提出了一种能使机器人从用户修正中逐步学习控制目标函数的技术。人类的修正可以和方向校正一样简单--即指示控制变化方向而不显示其大小的校正--在机器人运动过程中的某个时刻应用。我们只假设每个人的校正,无论其大小,指向一个方向,改善机器人当前的运动相对于一个隐式目标函数。该方法利用校正的方向来更新基于切割平面技术的目标函数估计。建立的理论结果表明,这种增量修正和更新过程保证了学习目标函数向隐式目标函数的收敛。该方法通过仿真和两款人-机器人游戏进行验证,其中人类玩家教一个2连杆机器人手臂和一个6-DoF四转子系统,用于在有障碍物的环境中进行运动规划。

论文地址

https://arxiv.org/abs/2011.15014v1

下载地址

https://arxiv.org/pdf/2011.15014v1.pdf

全部源码

https://github.com/wanxinjin/Learning-from-Directional-Corrections

运动规划

相关推荐

暂无评论

微信扫一扫,分享到朋友圈

增量方向校正的学习