相机看待世界的方式与人类不同。分辨率、设备、照明、距离和大气条件会影响人们如何解读照片上的物体。对于能源部橡树岭国家实验室的软件工程师SophieVoisin来说,图像可以揭示人眼看不到的东西,为理解世界每天的变化提供了不同的视角。
从技术上讲,Voisin在ORNL的工作都是关于图像的——增强、改进、分析和利用无人机的高空和低空图像以及全动态视频。每天,卫星都使用称为传感器的摄像头来查看世界各地正在发生的事情。每天拍摄的图像量是巨大的。这就是Voisin真正的技术热情发挥作用的地方。
“我喜欢编码。我喜欢编程算法的技术方面,以找到最佳点,将最新和最伟大的研究应用于实际问题,”Voisin说。“我可以立即查看对我的算法所做的更改是否正确应用。”
保持速度、准确性
在过去的七年里,Voisin一直在培育算法,以更快地处理越来越大的图像集合。从最初的一个小应用程序发展到12个项目;她现在作为主要调查员领导一个由32人组成的团队。该团队旨在利用软件开发、科学研究和软件工程来确定哪些图像显示了美国政府可能感兴趣的景观变化。通过让计算机对最初的大量图片进行分类并标记某些图片,分析人员可以审查和解释哪些图片实际上对决策者有价值。
图像处理不是一个简单的过程。随着传感器捕获更多世界快照,原始图像的绝对数量继续增加。处理每个图像会将其大小增加两倍或三倍。由于大型文件构成庞大的数据集,高性能计算机提供了以做出相关决策所需的速度处理图像的最佳机会。利用ORNL高性能计算机的速度,Voisin的团队还努力提供对结果准确性的高度信心。
在过去的五年中,随着硬件的变化和显卡功能的提高,Voisin对应用程序进行了调整和维护。为了防止算法崩溃,Voisin和她的团队在新硬件上线之前对其进行测试,以确保信息的持续流动。
算法有所作为
Voisin说,虽然图像就是图像,但不同的是文件的大小。自从开始攻读计算机科学和图像处理博士课程以来,她一直在高通量同位素反应堆(美国能源部科学办公室用户设施)的光束线上工作,研究乳房X线照片和现在的地理空间图像的医学成像。对她来说,为不同类型的图像开发和调整算法的挑战是令人兴奋的部分。
“国家安全工作的步伐与其他行业不同。我可以测试算法以拟合数据,然后将其上传到项目中,”Voisin说。但是要将机器学习算法应用于数据,计算机科学家需要训练数据。
训练数据有助于模型学习在图像中寻找什么。一种新算法可能不知道厢式货车和房屋之间的区别,因为两者都可能显示为正方形。计算机科学家编写算法来检测某些特征,然后训练算法区分“方形”并确定哪些需要标记以进行进一步分析。
继续向同事学习
自从十多年前从法国搬到美国以来,东田纳西州一直是Voisin和她的家人的家。她和她的丈夫在ORNL找到了从事引人入胜的项目并通过应用研究产生影响的机会。
“我来到实验室是为了获得研究机会,但日常工作是关于与你一起工作的人,我很感谢与一个出色的团队一起工作,”Voisin说。“与同事建立良好的关系促使我成为一名优秀的导师,因为我仍在向他人学习很多东西。”