AI算法不一致地检测糖尿病眼病

导读研究人员发现,尽管一些人工智能软件的测试结果相当不错,但只有一个软件达到了人工筛选器的性能。糖尿病仍然是成年人新发失明病例的主要原

研究人员发现,尽管一些人工智能软件的测试结果相当不错,但只有一个软件达到了人工筛选器的性能。糖尿病仍然是成年人新发失明病例的主要原因。但是目前眼保健提供者的短缺将无法满足为这一人群提供必要的年度筛查的需求。一项新研究着眼于七种基于人工智能的筛查算法在诊断糖尿病视网膜病变方面的有效性,糖尿病视网膜病变是导致视力丧失的最常见的糖尿病眼病。

在Diabetes Care发表的一篇论文中,研究人员将算法与视网膜专家的诊断专业知识进行了比较。五家公司生产了经过测试的算法——两家在(Eyenuk,Retina-AI Health),一家在(Airdoc),一家在葡萄牙(Retmarker),一家在法国(OphtAI)。

研究人员在 2006 年至 2018 年期间在退伍事务部普吉特海湾医疗保健系统和亚特兰大弗吉尼亚医疗保健系统寻求糖尿病视网膜病变筛查的近 24,000 名退伍的视网膜图像上部署了基于算法的技术。

研究人员发现,这些算法的表现不如他们声称的那么好。其中许多公司在临床研究中报告了出色的结果。但是他们在现实世界中的表现是未知的。研究人员进行了一项测试,其中将每种算法的性能以及在 VA 远程视网膜筛查系统中工作的人类筛查人员的性能都与专家眼科医生在查看相同图像时给出的诊断进行了比较。与医生的诊断相比,其中三种算法的表现相当不错,一种表现更差。但只有一种算法在测试中的表现与人工筛选者一样好。

华盛顿大学医学院眼科助理教授、首席研究员 Aaron Lee 说:“令人震惊的是,这些算法中的一些无法始终如一地执行,因为它们在世界某个地方被使用。”

相机设备和技术的差异可能是一种解释。研究人员表示,他们的试验表明,对于任何想要首先使用 AI 筛选器进行测试并遵循有关如何正确获取患者眼睛图像的指导方针的实践来说,这是多么重要,因为这些算法旨在以最低质量工作的图像。

该研究还发现,在分析西雅图和亚特兰大护理环境中患者群体的图像时,算法的性能各不相同。这是一个令人惊讶的结果,可能表明算法需要使用更广泛的图像进行训练。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢