从专家演示中学习可变形对象操作

2022-07-26 17:17:54

导读操纵可变形物体是机器人技术中的一个难题。最近在 arXiv.org 上的一篇论文提出了从演示中学习的方法——从演示中进行变形操作 (DMfD) ...

操纵可变形物体是机器人技术中的一个难题。最近在 arXiv.org 上的一篇论文提出了从演示中学习的方法——从演示中进行变形操作 (DMfD) 作为解决方案。它在在线学习的同时吸收专家指导，以解决具有挑战性的可变形操作任务，例如布料折叠。

研究人员在优势加权损失中添加了一个探索术语，以鼓励广泛的探索。不是总是将代理重置为专家看到的状态，而是概率性地调用参考状态初始化。这促进了在难以到达的州的探索和学习。

DMfD 部署在具有最小 sim2real 间隙的真实机器人上，因此表明它可以在真实世界环境中工作。该方法在基于状态的环境和基于图像的环境中都优于基线。

我们提出了一种新颖的从演示中学习 (LfD) 方法，即演示中的可变形操作 (DMfD)，在给定专家演示的情况下，使用状态或图像作为输入来解决可变形操作任务。我们的方法以三种不同的方式使用演示，并平衡在线探索环境和使用专家指导有效探索高维空间之间的权衡。我们针对 SoftGym 任务套件中的一维绳索和二维布的一组代表性操作任务测试 DMfD，每个任务都有状态和图像观察。我们的方法在基于状态的任务上超过基线性能高达 12.9%，在基于图像的任务上高达 33.44%，对随机性具有相当或更好的鲁棒性。此外，我们使用基于图像的观察创建了两个用于折叠 2D 布料的具有挑战性的环境，并为它们设置了性能基准。

免责声明：本文由用户上传，如有侵权请联系删除！

标签：