0731-88575016

详细内容

竞技宝官网app·中科院声学所黄海宁团队:声呐图像水下目标识别综述与展望

时间发布时间:2024-09-08 10:45:22 来源:竞技宝app下载官网 作者:竞技宝官网地址     

  成像声呐利用波束形成技术或单阵元的指向性,将测向和测距结合,可形成对水下环境的二维(三维)观测图像。

  前视声呐是二维声呐成像技术的典型应用,可在距离向(径向)利用窄脉冲测距,方位向(轴向)通过机械扫描、波束形成或声学透镜等技术进行测向,其效果如图 1 所示。

  侧扫声呐是将声波测距和声呐平台的运动相结合的一种二维声呐成像技术,声呐换能器可加装在平台的左右舷,在垂直航迹的斜距方向上通过脉冲测距,依靠平台的运动实现扫描成像,成像效果如图 2 所示。

  合成孔径声呐是继侧扫声呐发展出的另一种高分辨声呐成像技术,它通过对沿直线运动的声基阵在不同时刻发射和接收的回波进行相干处理,可形成可变的虚拟大孔径,能实现更高的、不随探测距离降低的沿航向分辨率,其成像效果如图 3 所示。

  与二维成像声呐相比,三维声呐兼具水平和垂直窄波束 , 具有很强的抗混响能力 , 更适合浑浊水和浅水等高混响环境下的探测。三维声呐成像声呐可分为多波束测深仪、干涉合成孔径声呐、前视三维声呐等多种类型。多波束测深仪通过发射和接收垂直和水平窄波束,可对波束覆盖的重叠区域(即所谓波束脚印)进行测距实现三维测量,成像效果如图 4 所示。干涉合成孔径声呐采用平行双接收阵的布阵形式,通过对配准图像的干涉处理,形成对海底高度的观测,成像效果如图 5 所示。另外,视三维声呐可通过单次脉冲发射一次性获得场景中水平、垂直和距离三个维度的信息,成像效果如图 6 所示。

  其中,在特征提取部分已积累了大量研究工作,从设计目标判定规则和模板、多特征组合优化、多视角多模态,以及统计分析等多种角度,提升了二维声呐图像目标识别性能。

  分类识别的主要工作是将 ROI 分配到预定义的类中,例如利用卷积神经网络对 SAS 图像目标进行分类识别、利用迁移学习进行模型微调、利用小样本学习降低过拟合。深度学习的目标检测则是以包围框的形式直接输出物体的位置和类型,多会结合注意力机制以及轻量化网络,在提高检测性能的同时减小计算复杂度。

  二维声呐图像的传统机器学习和深度学习的方法比较如表 1 所示。事实上,在复杂的水下环境下,提取目标稳定特征绝非易事;而有限的样本量无法保证模型的泛化能力。因此,将目标确定性的特征引入到深度学习网络对提高目标识别的精度是有帮助的。

  和二维图像相比,三维图像识别最大的差异在于如何处理增加的维度带来的信息量剧增的问题。三维图像识别方法大致可以分成:

  二维化方法在三维声呐图像问题中受到了最广泛的关注,在经典框架的基础上,将其中一个或多个环节用深度神经网络代替,通过结合显著性检测、全连接层调优、目标空间关联特性提取等多个层面进行网络优化,使目标识别率显著上升。基于体素的三维数据表示方法可以视作对二维图像的简单推广,类似于二维图像中像素的概念,每一个三维采样点被称为体素,这样可以将二维图像处理方法推广到三维,例如将二维的直线参数方程近似方法推广到三维坐标下,将二维卷积操作直接扩展到三维,或是以体素的形式将三维声图直接送入模型进行端对端训练,可以获得在识别率和 ROC 曲线等指标上的明显提升。在不考虑透射作用的高频声呐中,声波对场景表面成像,视角内各个波束波达方向的测距结果就是一种典型的点云描述。这种语境下,一类基于聚类算法的物体分割和检测方法能有效处理三维扫描声呐探测的水下目标提取、定位以及地形恢复。在大数据驱动下,点云分割和物体检测问题得到了更好的解决,通过采用多帧数据进行场景三维重建、融合两个成像平面相互垂直的二维前视声呐图像、以及结合二维和三维联合检测的新思路,能有效实现对目标的精确确认和空间定位。

  三维声呐图像的识别方法比较如表 2 所示。目前,大部分三维声呐水下目标识别研究采用了二维化处理的方法,少部分涉及基于体素或点云的全三维处理。

  声呐图像序列关联识别通常会联合多帧图像信息进行空间、时间上的信息关联,通过对目标进行序贯检测或跟踪关联增加识别准确率。声呐图像序列的关联识别方法对比如表 3 所示。与单帧图像的检测识别相比,通过多帧图像信息累积的识别方法具有两方面优势:

  ( b ) 可以根据联想和预测物体的实时状态变化,在状态空间上对不同动态表现的目标进行分类识别。相比之下,特征辅助的数据关联方法可以获得更优的全局假设结果。

  声呐图像目标识别有着巨大的发展前景,受到越来越多研究者的关注。近年来随着深度学习技术的发展,该领域取得了一定的突破,但仍存在一些难以解决的问题,包括:

  ( 1 )   小样本问题:水下声呐系统需要特殊的装备和船只,以及高度专业化的技术人员,这使得数据采集变得昂贵和耗时。另外,由于涉及敏感信息和,导致数据采集过程受到了限制,使得公开的数据集相对较少。在数据稀缺的情况下,模型的性能和泛化能力可能会受到严重限制。

  ( 2 )   类不平衡问题:不同水下目标类别在数据集中的样本数量差异较大,这将导致模型倾向于对样本数较多的类别进行过度学习,而对样本数较少的类别学习不足,从而影响了模型的性能和泛化能力。

  ( 3 )   目标特征弱问题:相比于光学图像,声呐图像通常分辨率不足,部分成像声呐分辨率随距离下降明显,难以在安全距离下形成对目标的有效识别;且易受到复杂多变的水下环境和不稳定的平台运动状态的影响,信噪比较低,成像质量不稳定,虚警较高。

  ( 4 )   目标多样化问题:不同类型的水下目标,如水雷、基阵、预置系统等,其形状、材质、尺寸均会对声学特征产生影响,而同一目标在不同时空条件下的成像结果同样存在差异。

  ( 5 )   目标识别可解释性差问题:随着深度学习技术的普及,机器学习模型的复杂性也随之增加,这使得模型的决策过程变得越发难以解释。

  ( 1 )   图像生成:通过合成声呐数据,可以增加可用于模型训练的样本数量,从而减轻数据稀缺性的问题。另一方面,通过创建具有已知特征和标签的合成声呐数据,这使得模型能够更快速地学习和理解不同目标的声呐信号特。

  ( 2 )   增量学习:传统的重新训练模型方法可能会导致较长的停机时间,而这在实际应用中可能是不可接受的。增量学习的能力使得模型能够在不中断系统运行的情况下,通过逐步学习新的数据来不断改进性能。

  ( 3 )   设计低复杂度神经网络结构:嵌入式系统或无人平台的计算能力有限,需要选择适应这种环境的轻量级结构,这对于水下目标探测至关重要。低复杂度的网络结构可以保证在有限资源下实现快速的推理和响应。

  ( 4 )   知识和数据驱动的信息整合:知识和数据联合驱动是将领域专业知识与大规模数据的分析相结合,以提高系统的性能和智能度。在声呐图像识别中,这一理念的应用对于更精准、高效地探测和识别水下目标具有巨大潜力。

  ( 5 )   特征工程和统计学习:特征工程和传统的统计学习在机器学习和数据科学领域中有着深远的影响和重要性。这两者不仅为模型提供了关键的输入,还为解决现实世界中的复杂问题提供了基础和框架。尤其是在数据稀缺、解释性要求高或者模型需求简单的情况下,传统方法往往更加高效和可靠。

  本文主要对声呐图像目标识别技术进行了梳理,总结了典型成像声呐的工作原理和应用场景,重点阐述了二维成像声呐和三维成像声呐目标识别的研究进展,对声呐图像目标识别存在的小样本问题、类间不平衡问题、目标特征弱问题、目标多样化问题和目标识别可解释性差等问题进行了总结;同时,对未来可能存在的研究方向声呐图像生成、增量学习、低复杂度神经网络、知识与数据联合驱动、特征工程和统计学习进行了展望。

  黄海宁:研究员,博士生导师,《电子与信息学报》编委。主要研究方向为水声信号与信息处理、水声通信与网络和极地声学等 .

  本号发布信息旨在传播交流。如涉及图文版权等问题,请在 20 日内与本号联系,我们将第一时间处理。


竞技宝官网app
电话:13973131243
邮箱:dingdangang@douyin.com
地址:竞技宝官网app
扫一扫浏览手机站