眼睛成像技术如何帮助机器人和汽车看得更清楚

导读尽管机器人没有带视网膜的眼睛,但帮助它们更自然、更安全地看到世界并与世界互动的关键可能在于眼科医生办公室中常见的光学相干断层扫描

尽管机器人没有带视网膜的眼睛,但帮助它们更自然、更安全地看到世界并与世界互动的关键可能在于眼科医生办公室中常见的光学相干断层扫描 (OCT) 机器。

许多机器人公司正在集成到其传感器包中的成像技术之一是光探测和测距,简称 LiDAR。目前,自动驾驶汽车开发商非常关注和投资,这种方法基本上像雷达一样工作,但它不是发送广泛的无线电波并寻找反射,而是使用来自激光的短脉冲光。

然而,传统的飞行时间激光雷达有许多缺点,使其难以在许多 3D 视觉应用中使用。因为它需要检测非常微弱的反射光信号,所以其他 LiDAR 系统甚至环境阳光很容易使检测器不堪重负。它还具有有限的深度分辨率,并且可能需要很长时间才能密集扫描高速公路或工厂车间等大面积区域。为了应对这些挑战,研究人员正在转向一种称为调频连续波 (FMCW) 激光雷达的激光雷达形式。

“FMCW LiDAR 与 OCT 具有相同的工作原理,OCT 是生物医学工程领域自 1990 年代初以来一直在发展的,”博士说。在杜克大学生物医学工程迈克尔·J·菲茨帕特里克杰出教授约瑟夫·伊扎特实验室工作的学生。“但 30 年前,没有人知道自动驾驶汽车或机器人会成为一件事,因此该技术专注于组织成像。现在,为了使其对这些其他新兴领域有用,我们需要用其极高的分辨率能力换取更远的距离和速度。”

在 3 月 29 日发表在Nature Communications杂志上的一篇论文中,杜克团队展示了从他们的 OCT 研究中学到的一些技巧如何可以将之前的 FMCW LiDAR 数据吞吐量提高 25 倍,同时仍能达到亚毫米深度精度。

OCT 是超声波的光学模拟,它通过将声波发送到物体中并测量它们返回所需的时间来工作。为了计时光波的返回时间,OCT 设备测量它们的相位与行进相同距离但未与另一个物体相互作用的相同光波相比发生了多少变化。

FMCW LiDAR 采用了类似的方法,并进行了一些调整。该技术发出的激光束在不同频率之间不断变化。当探测器收集光线以测量其反射时间时,它可以区分特定频率模式和任何其他光源,使其能够在各种光照条件下以非常高的速度工作。然后,它测量不受阻碍的光束的任何相移,这是一种比当前激光雷达系统更准确的距离确定方法。

“看到我们几十年来一直在研究的生物细胞规模成像技术如何直接转化为大规模实时 3D 视觉,这非常令人兴奋,”Izatt 说。“这些正是机器人安全地看到人类并与人类互动,甚至在增强现实中用实时 3D 视频替换化身所需的能力。”

以前大多数使用 LiDAR 的工作都依赖于旋转镜在景观上扫描激光。虽然这种方法效果很好,但它从根本上受到机械镜速度的限制,无论它使用的激光有多强大。

杜克大学的研究人员改为使用像棱镜一样工作的衍射光栅,将激光分解成彩虹般的频率,当它们远离光源时,这些频率会扩散开来。由于原始激光仍在快速扫描一系列频率,这转化为扫描激光雷达光束的速度比机械镜旋转的速度要快得多。这使系统可以快速覆盖广阔的区域,而不会损失太多的深度或位置精度。

虽然 OCT 设备用于描绘物体内深达几毫米的微观结构,但机器人 3D 视觉系统只需要定位人类尺度物体的表面。为了做到这一点,研究人员缩小了 OCT 使用的频率范围,只寻找物体表面产生的峰值信号。这会降低系统的分辨率,但成像范围和速度比传统激光雷达要大得多。

结果是 FMCW LiDAR 系统实现了亚毫米级定位精度,数据吞吐量比以前的演示高 25 倍。结果表明,该方法足够快速和准确,可以实时捕捉移动人体部位的细节,例如点头或握紧的手。

“就像电子相机已经无处不在一样,我们的愿景是开发新一代基于 LiDAR 的 3D 相机,这些相机速度快、能力强,足以将 3D 视觉集成到各种产品中,”Izatt 说。“我们周围的世界是 3D 的,所以如果我们希望机器人和其他自动化系统自然而安全地与我们互动,他们需要能够看到我们,就像我们能看到它们一样。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢