导读 操纵可变形物体是机器人技术中的一个难题。最近在 arXiv.org 上的一篇论文提出了从演示中学习的方法——从演示中进行变形操作 (DMfD) ...
操纵可变形物体是机器人技术中的一个难题。最近在 arXiv.org 上的一篇论文提出了从演示中学习的方法——从演示中进行变形操作 (DMfD) 作为解决方案。它在在线学习的同时吸收专家指导,以解决具有挑战性的可变形操作任务,例如布料折叠。
研究人员在优势加权损失中添加了一个探索术语,以鼓励广泛的探索。不是总是将代理重置为专家看到的状态,而是概率性地调用参考状态初始化。这促进了在难以到达的州的探索和学习。
DMfD 部署在具有最小 sim2real 间隙的真实机器人上,因此表明它可以在真实世界环境中工作。该方法在基于状态的环境和基于图像的环境中都优于基线。
我们提出了一种新颖的从演示中学习 (LfD) 方法,即演示中的可变形操作 (DMfD),在给定专家演示的情况下,使用状态或图像作为输入来解决可变形操作任务。我们的方法以三种不同的方式使用演示,并平衡在线探索环境和使用专家指导有效探索高维空间之间的权衡。我们针对 SoftGym 任务套件中的一维绳索和二维布的一组代表性操作任务测试 DMfD,每个任务都有状态和图像观察。我们的方法在基于状态的任务上超过基线性能高达 12.9%,在基于图像的任务上高达 33.44%,对随机性具有相当或更好的鲁棒性。此外,我们使用基于图像的观察创建了两个用于折叠 2D 布料的具有挑战性的环境,并为它们设置了性能基准。