超过一百万的美国成年人使用配有机械臂的轮椅来帮助他们执行日常工作,例如穿衣,刷牙和饮食。但是目前市场上的机器人设备可能很难控制。从冰箱中取出食物容器或打开柜门可能要花费很长时间。而且使用机器人来养活自己更加困难,因为该任务需要精细的操作。
斯坦福大学的一个研究小组现在已经开发出一种新颖的方法来控制辅助机械臂,该方法比现有方法更直观,更快捷。在实验中,他们的机器人控制器使受试者可以更有效地将豆腐切碎并将其铲在盘子上,或者刺入棉花糖,将其sc入糖霜中,然后将其浸入。
“进给是我最喜欢处理的问题之一,因为从机器人技术的角度来看这很困难;它需要精确的操纵,而且这是一项基本任务,您需要每天给自己养活,”计算机科学助理教授Dorsa Sadigh说道。斯坦福大学的电子工程系,以及斯坦福人类中心人工智能研究所(HAI)的附属教员。她也说:“您可以在眼前看到它的好处。”
Sadigh的团队由工程学研究生Hong Jun Jeon和计算机科学博士后Dylan P.Losey组成,他们开发了一种融合了两种人工智能算法的控制器。第一个是由Sadigh的小组开发的,它可以在操纵杆上进行二维控制,而无需在模式之间进行切换。例如,它使用上下文提示来确定用户是伸手拿门把手还是喝水杯。然后,当机器人手臂接近其目的地时,第二种算法开始执行,以实现更精确的运动,并在人与机器人之间共享控制权。
减少维度
现在市场上的典型辅助机器人具有6-7个关节。Sadigh说,要控制它们中的每一个,用户都需要在操纵杆上的各种模式之间切换,这是不直观的,令人费解的精神,并且要花费大量时间。“这些机器人无处不在,但是使用它们仍然是真正的挑战。”
团队想知道:仅能在两个方向(上/下;左/右)发出指令的操纵杆能平稳,快速地控制多关节机器人吗?为了解决这个问题,他们转向了称为降维的过程。在任何给定的上下文中,机械臂实际上不必在每个可能的方向上移动每个关节即可完成特定任务。较小的一组动作通常就足够了。萨迪格解释说:“关键的洞察力是,在特定条件下,例如上下文,机器人将知道,向右推动操纵杆就意味着特定的事情,例如拿起杯子。” “在没有告诉我的情况下,机器人会根据上下文确定要注意的最重要的事情。”
降维过程始于人类(即研究生)通过各种任务特定的动作来移动机器人手臂,实质上是训练机器人如何在给定的背景下以更加流畅和有用的方式运动。然后,此高维数据集通过神经网络(自动编码器)进行馈送,该神经网络首先将数据压缩为二维,然后对压缩的表示进行解码,以尝试重新创建初始专家数据。Sadigh说:“这是确保压缩有效的方式,因为它能够再现专家数据。”
下一步就是魔术发生的地方:一个人在操纵杆上给出二维指令,机器人能够重新创建专家训练过的更复杂,与上下文相关的动作。在实验中,当用户仅使用此“潜在动作”算法控制机器人时,他们可以捡起一个鸡蛋,一个苹果和一杯面粉,然后将它们放入碗中(可以说是制作“苹果派”)比现有方法需要在操纵杆上进行模式转换更快。尽管速度有所提高,但用户发现界面不可预测。萨迪格说:“它做对了,但用户不确定为什么。”
添加共享自治
潜在动作控制器也不是很精确。为了解决该问题,团队将潜在动作算法与一种称为共享自治的算法进行了混合。在这里,新颖之处在于团队将两种算法集成在一起的方式。萨迪格说:“这不是一个附加程序。” “系统一起训练。”
在共享自治中,机器人从一组“信念”开始,这些信念是关于控制器告诉机器人要做的事情,并随着给出额外的指令而对目标产生信心。由于机器人实际上并不是有感觉的,所以这些信念实际上只是概率。例如,面对两杯水,机器人可能会开始相信,甚至有机会捡起其中一个。但是,当操纵杆将其引导至一个杯子而又远离另一个杯子时,机器人会获得对目标的信心并开始接手-与用户共享自主权,以更精确地控制机器人手臂。机器人执行的控制量也是概率性的:如果机器人对杯子A而不是杯子B有80%的置信度,那么它将获得80%的控制权,而人类仍然拥有20%的控制权,
为了测试集成算法,该团队进行了实验,用户可以控制装有叉子的机械臂。他们的任务(在此视频中显示):切开并to起豆腐,或刺入棉花糖,将其入糖霜中,然后蘸一点。结果:与单独的潜在动作算法或单独的或带有共享自治权的标准控制器相比,使用组合算法(具有共享自治权的潜在动作)的控制器对用户的控制更快,更容易。
Jeon说,在团队的算法影响残疾人的生活之前,还有很多工作要做。需要对系统进行培训,以使用计算机视觉并在多种情况下运行。最终应该进行一项研究,使大量的残疾人有机会测试控制器。从长远来看,希望是基于AI的辅助机器人技术将使残疾人的生活更加轻松。Jeon说:“这赋予了力量。” 他说:“这使人们在做事上更具代理权。