导读显着对象检测(SOD)是一种定位和分割图像中最具吸引力的对象的任务,广泛用于对象识别、对象跟踪或图像检索等任务。然而,仅针对光学遥感图...
显着对象检测(SOD)是一种定位和分割图像中最具吸引力的对象的任务,广泛用于对象识别、对象跟踪或图像检索等任务。然而,仅针对光学遥感图像(RSI——从高海拔捕获的图像)的SOD的研究有限。
最近发表在arXiv.org上的一篇论文提出了一种轻量级的多尺度上下文网络,用于在光学RSI中进行准确的显着目标检测。为了准确定位和分割不同尺度的显着对象,研究人员提出了一种多尺度上下文提取模块。基于注意力的金字塔特征聚合机制逐渐融合多层特征图,以进一步细化和补充显着图。
实验评估表明,所提出的轻量级模型与最先进的SOD解决方案具有可比的精度。
由于光学遥感图像(RSI)中的多尺度变化更加剧烈,前景和背景更加复杂,光学RSI的显着目标检测(SOD)成为一个巨大的挑战。然而,与自然场景图像(NSI)不同,关于光学RSISOD任务的讨论仍然很少。在本文中,我们提出了一种多尺度上下文网络,即MSCNet,用于光学RSI中的SOD。具体来说,采用多尺度上下文提取模块,通过有效学习多尺度上下文信息来解决显着对象的尺度变化。同时,为了准确检测复杂背景中的完整显着对象,我们设计了一种基于注意力的金字塔特征聚合机制,用于从多尺度上下文提取模块中逐步聚合和细化显着区域。在两个基准上进行的大量实验表明,MSCNet仅使用3.26M参数即可实现具有竞争力的性能。