-
0 引言
-
大型水下航行体特征提取是海洋工程中一个重要的基础性研究课题,尤其是针对远场低频特征的相关研究,近年来逐渐成为了热点与难点。通过分析低频特征有利于掌握水下航行体的许多信息,对水下目标探测与鉴别起到了积极作用。
-
由于大型水下航行体存在水声数据样本少、环境时变、信噪比低等问题,各种方法的特征提取难度大大增加。一方面,从水声数据中提取出高质量的特征具有一定困难;另一方面,对于特征的提取与鉴别机制尚不完善,目前较流行的基于数据的智能方法尚无法取得可解释性的效果,基于专家知识的传统提取鉴别方法由于严重依赖经验使得结果稳定性不足。因此,对于水下大型航行体远场低频特征提取问题,寻求一种满足现有数据条件的方法显得尤为重要和迫切。本文对当前使用的几种水下大型航行体特征提取方法进行了综述,并展望了未来特征提取方法的发展方向,希望对于改进当前水下低频特征提取的不足产生积极意义。
-
随着水声领域探测技术的发展,对水下目标的探测频率甚至能够低至几赫兹,由于深海声信道具有时变性、低信噪比等特点,对于水下大型航行体远场低频特征的提取鉴别变得异常困难。目前较为流行的方法有 2 种,一种是使用传统方法与智能方法相结合,另一种是直接使用智能方法进行特征提取,后者一般是通过深度神经网络完成。然而,多数神经网络方法对数据样本的要求过于苛刻,而这正是水声领域一直以来所面临的短板。因此,小样本的水下大型航行体目标低频特征提取问题亟待解决。本文从传统方法和智能方法 2 个方面对国内外在相关领域的研究做了综述。
-
1 水下低频特征提取的传统方法
-
传统方法针对水下大型体的低频特征主要是从时频域单独、时频域结合和人体感官等方面进行提取[1]。
-
1.1 时频域单独特征提取
-
水下航行体时域特征提取比较简单,主要是分析目标传回来的时域波形结构,用统计的方法提取出目标比较明显的特征。国内研究者对此进行过比较深入的研究。1999 年,蔡悦斌等[2]利用噪声信号的过零点、幅值、波长差、波列面积等特性提取噪声信号的特征,得到了 11 维特征信息,并对噪声信号的时域波形结构特征进行分类。2015 年,孟庆昕等[3]类比音色特征,对商船和水面运输机 2 类水面目标时域波形结构特征进行提取,得到了 9 维特征矢量,将其输入分类器中可以有效识别两类水面目标。
-
水下航行体时域波形结构特征提取方法虽然比较简单,但是使用范围受限严重,在隐身技术飞速发展的现代,信噪比过小时,水下航行体的时域波形特征提取很难实现,因此研究者转而分析信号的频域特征。但是单独的频域分析使用较少,常用的是对信号的连续谱和线谱分析,因为线谱的唯一性,以线谱为特征具有很高的识别率,这在吴国清等[4]的调查中曾被证明。
-
1.2 时频域结合特征提取
-
相较于单独使用水下航行体的时域特征和频域特征,时频域结合的特征提取在国内外的研究中更为流行[1]。起初人们发现单独的频域分析虽然对有限平稳的周期信号非常有效,可以处理时域上难以提取的特征,但是却无法时、频两域结合分析,因此人们引入了短时傅里叶变换。然而,在研究中发现,无论传统傅里叶变换的频域分析还是短时傅里叶变换的时频两域分析,都对非平稳信号的处理效果欠佳,而且短时傅里叶变换中固定窗长使得信号有时分辨率不足。针对于此,研究者们引入了一种新的数学工具——小波函数。
-
小波变换的多种形式中有一种是离散二进制小波变换,可以保持信号的时移不变形性,对信号的奇异点进行检测。赵建平等[5]用二进离散小波变换提取信号回波边缘特征,到了四阶以上就对 4 种湖底介质返回的无规、低 SNR 信号有很高的分辨力,而且离散二进小波变换计算量小,有快的处理速率。卜英勇等[6]针对传统 Hilbert 变换复解析信号时遇到直流会出现毛刺的问题,构造了新的包络滤波器,使信号的实对称小波满足条件以得到信号的包络,用离散小波变换提取信号包络尾部特征,分辨出细、中、粗沙和砾石 4 种水底介质。离散小波变换提取信号特征较连续小波变换计算量小,可以在提取信号特征的同时起到压缩的作用,处理速度快。目前对于奇异点处目标信号特征提取,二进离散小波变换是一种非常有效的手段,可以得到目标的表面形状、结构、材料等特征。张静远等[7] 基于小波变换实现了包括奇异性特征提取在内的 4 种特征提取方法,另外 3 种分别是提取的信号能量特征、熵特征以及适应性小波网络的特征,得到了很好的效果。上述几种小波变换方法进行的特征提取虽然效果都很好,但都是对水底不同类型的底质回波信号进行特征提取,与实际目标特征关系不是很大。郭雪松[8]基于李秀坤对弹性亮点模型特征的研究,提出将连续小波变换和离散小波变换应用于目标弹性亮点干涉谱的提取。该研究更加贴近于水雷、潜艇等实际目标。CANG 等[9]使用二阶同步压缩变换提取信号特征,他们先对信号进行连续小波变换,再计算解调信号频率初值估计,最后重新分配压缩连续小波变换,较通常的小波变换有更强的时频特征提取能力。
-
低频分析和记录(Low Frequency Analysis and Recording,LOFAR)、噪声包络调制检测(Detection of Enveloped Modulation on Noise,DEMON)是 2 种常用的信号分析手段[10],前者可以提取信号中宽带线谱特征,却无法提取信号的轴频和倍频特征,后者可以解调以提取信号的低频包络谱,从而提取信号中的轴频、叶频等特征。二者互补中可以提取出较为准确的信号时频特征,是如今水下大型航行体低频特征提取的常用方法。需要注意的是,传统的 LOFAR 谱与 DEMON 谱相结合进行特征提取时,可能会出现 2 类特征的“兼并”现象,无法分辨出是 2 个信号特征,导致特征的遗漏。针对于此,CHO 等[11]提出来一种基于调制谱图域的水下信号综合分析算法,可以分辨不同信号特征的视觉差异,提高计算效率,对“兼并”现象有一定的改进效果。
-
1.3 基于人体感官特征提取
-
基于人体感知的特征提取也可以处理水下大型航行体特征,而且有利于声呐操作人员判断目标的类型。
-
听觉方面:之前已有基于听觉响度的特征提取计算模型,但响度易受到海况等因素的影响。因此,杨阳[12]研究了基于音色参量的声呐回波特征,结合高阶谱,可以更有效地抑制噪声,提高信混比。音色参量和高阶谱的结合可以减小海况对信号特征提取的影响,有利于更准确地识别目标特征。吴姚振[13]提出了 5 种基于听觉滤波的特征提取方法,其性能优于传统的 MFCC、LPCC、PLP 方法。不过他的实验是在加性噪声的前提下进行的,对加性和卷积混合的噪声并没有分析。
-
视觉方面:基于人体视觉感官的特征提取一般是二维特征提取,可以对水下图像进行特征提取。计算机视觉工具是不可或缺的一个重要工具, ZHANG 等[14]将视觉检测应用于水下图像特征提取求解鲁棒性问题,形成了更稳定、更贴近人类认知机制的特征提取算法。NAGARAJA 等[15]先利用同态滤波、曲波去噪和 LBP 扩散相结合增强水下图像,再从中提取出有效的、鲁棒性的特征,可以提高图像特征的识别度。
-
上述几种基于人体感官的特征提取在实际应用中有一定的优势,但并不完善,无法完全贴合人体的感觉以分辨不同的目标,所以此类特征提取方法仍有发展空间。
-
1.4 传统方法的局限性
-
针对水下大型航行体远场低频特征,传统的方法通常在预处理和特征提取过程中需要一定的先验知识,并且需要引入某些假设,容易出现信息丢失的问题。虽然现存的水下航行体声学不变特征的提取方法五花八门,但由于开展水下试验需要投入大量人力物力,数据获取代价较大,普遍缺乏对水下航行体的系统性认识,提取结果往往易受非目标干扰影响,不仅如此,复杂的水声环境、目标的运动姿态等因素也对特征提取增加了难度。从文献可知,现存的水声目标特征提取方法大多不能实现对非目标特征、环境噪声和目标噪声的有效分离,提取结果往往包含大量的非目标干扰,这无疑给下一步的特征鉴别造成了一定困难。因此,研究人员致力于寻找性能更优的智能方法。
-
2 水下低频特征提取早期智能方法
-
针对水下大型航行体低频特征的提取与鉴别,智能的方法有专家系统、统计类方法和人工神经网络方法。其中专家系统依靠领域内专业知识来推理分析目标特征,以实现目标识别;统计类方法依靠各种判决系统来分类识别目标,如支持向量机 (SVM)[16-18];浅层人工神经网络(Artificial Neural Network,ANN)方法是目标识别领域潜力最大也是最为火热的目标识别方法。
-
在人工神经网络推广之前,最早的水下航行体特征分类算法是经典统计模式分类方法[19],它利用之前已经收集到目标特征范例进行统计分析和基于距离度量的模式匹配,这种方法在当时对可识别目标的决策速度很快,但难以识别与模板不匹配的目标。20 世纪 70 年代,基于模型的算法、知识的算法和模糊集合理论的分类技术被广泛应用于水声目标识别,这些算法、技术的性能要优于传统的统计模式分类方法,然而实现较为复杂、知识验证和获取困难、主观性太强使它们的发展受到了限制。80 年代,人工神经网络技术被应用于水声领域的目标自动识别,为后来的自动识别技术打开了良好的开端。21 世纪初,深度神经网络步入历史的舞台,水声工作者也由此尝试使用深度神经网络提取常规方法难以分辨的深度特征,并且取得了良好的进展。如今,水下大型航行体特征提取方法引入了深度学习模型,基于深度神经网络的各种方法层出不穷,在许多应用中展现了强大的特征提取能力和优秀的识别效果。
-
人工神经网络技术是模仿大脑神经元的结构而发明的,包含许多结构单元,可以根据学习方式及内容不同而具有不同的功能。神经网络减少了声呐操作人员的工作量,提高了效率。神经网络的使用可以分为 2 个阶段:第 1 个阶段是学习阶段,第 2 个阶段是应用阶段。神经网络通过学习集(Learning Set)作为输入信号,分类识别已知参数的目标,以此来训练该神经网络,类似与人类学习知识。当该神经网络可以达到一定的识别率之后,进入应用阶段,可以用来分类判决未知的目标信号,以此达到最终自动识别目标的效果。目前自动目标识别技术还未发展至最终成熟阶段,基于人工神经网络得到的识别结果并不能完全被信赖,所以很多时候是机器自动识别与操作人员的判断相结合,以提高识别的准确率。
-
2.1 早期神经网络特征提取
-
水声领域使用的神经网络有 BP 神经网络、反馈神经网络、RBF 神经网络[20-21]、自组织竞争神经网络、有限脉冲神经网络[22]、概率神经网络[23]、深度学习神经网络等多种类型。其中 RBF 神经网络有着良好逼近能力、分类能力和学习速度,而且不易陷入局部极小值、训练时间比 BP 神经网络时间短,但是目前对水下大型航行体特征的研究较少,没有 BP 神经网络的应用广泛。在很多深度模型中也需要 BP 网络来调整参数。
-
BP 神经网络的诞生是 20 世纪 80 年代的 RUMELHART 和 McClelland 对神经网络的第 3 次里程碑式的优化,否定了之前研究人员认为多层感知器毫无意义的观点[24],从此神经网络进入了快速扩张的时期。基于 BP 算法的多层感知器较单层感知器有强大的非线性映射能力、泛化能力和容错能力[25]。每一个 BP 神经网络至少包含 3 层结构,即输入层、隐含层和输出层,有时候也可以有多个隐含层。BP 算法的学习过程包括输入信号的正向传播和误差的逆向传播 2 部分,如果输出信号误差超出期望值,它就会转向误差逆向传播,调整各层权值,再进行计算输出,周而复始,直到误差符合期望或者达到预设循环次数,学习过程结束,该神经网络进入应用阶段。
-
传统的 BP 网络收敛速度慢,国内外研究人员对于该缺点,常用的解决办法有动态调整学习步长、自适应改变惯性权值等[26],对于易受局部极小值影响的缺点,王菲提出了一种基于自适应遗传 BP 算法[27],与之前利用动量规则的改进算法比较,都可以改进传统的 BP 算法,王菲的自适应遗传 BP 算法效果更优;自 1992 年,ZHANG[28]提出小波神经网络的概念,许多学者将其不断优化,BAKSHI[29] 将小波函数和尺度函数结合,给出了网络的全局误差和局部误差的指标,ZHANG 等[30]将正交小波基引入神经网络,不过这种正交小波网络的解析形式很难构造,因此目前在实际中应用较少;SZU[31] 提出共轭梯度算法的小波神经网络,比文献[28]的随机梯度算法更快。ZHANG 等[32]以人工鱼群算法 (AFSA)[33]为基础,提出了一种改进的神经网络,该神经网络也可以优化传统 BP 神经网络收敛速度慢和易陷入局部最优的问题。袁骏等[34]将主成分分析(PCA)方法与 BP 神经网络结合,实验结果表明,在主成分个数较少时,可以有效提高目标识别率,但是当主成分个数较多时会降低识别率,因此需要合理选择主成分个数。
-
2.2 早期智能方法的局限性
-
早期智能方法中,专家系统存在可移植性差、学习能力差、上限低等问题,支持向量机对大规模的训练样本处理能力不足,并且难以胜任多分类问题,传统的 BP 神经网络收敛速度较慢,在遇到 2 种类别的目标数量差距较大时,小类目标的识别率很低,而且在多层网络中容易出现梯度消失的问题,所谓的梯度消失,是当 BP 网络层数较低时,可以得到较好的目标识别效果,但随层数的增加, BP 神经网络无法正常完成学习阶段。这是由于 BP 神经网络使用的 sigmoid 激活函数,该函数的导数值域非常小。
-
如图1 所示,sigmoid 函数的导数取值范围很小,当神经网络的层数增加,多个 sigmoid 函数的叠加作用下,就容易产生梯度消失问题,无法使 BP 神经网络的参数得到优化。
-
图1 Sigmoid 函数及其导数
-
Fig.1 Sigmoid function and its derivative
-
综合来看,虽然有许多研究人员对 BP 网络做了一些改进,但仍有各自的缺陷存在。因此,传统的 BP 神经网络在水下大型航行体目标特征提取和识别中发挥的作用有限,单纯地对 BP 神经网络优化改进无法满足当前水下低频目标特征提取和识别的需求,因此,深度神经网络逐渐成为研究的热点。
-
3 深度神经网络特征提取方法
-
由于多层 BP 神经网络容易出现梯度消失问题,所以当时深层的神经网络在各个领域一度陷入灰暗。直到 2006 年,HINTON 等[35]提出深度置信网络(DBN)这种快速算法,将深度学习带入新的发展阶段。时至今日,深度学习神经网络已被广泛应用于包括水声在内的各个领域。
-
深度神经网络较其他方法可以学习到更稳定的深度特征,这些深度特征有更高级的不变性,对于获得水下大型航行体的特征更有优势。目前针对水下大型航行体目标的特征提取和识别,常用的深度神经网络方法有:深度置信网络、卷积神经网络 (CNN)、循环神经网络(RNN)、自编码器(AE) 神经网络和其他神经网络。其他神经网络主要指生成对抗网络(GAN)和迁移学习使用的深度网络。
-
3.1 DBN 特征提取
-
国外学者 HINTON 等[35-36]提出了一种深度网络结构 DBN,其基本结构为受限玻尔兹曼机 (RBM),如图2 所示,RBM 结构中同一层的神经元之间没有连接,相邻的显层和隐层之间的神经元全连接。DBN 在训练时采用逐层贪婪的算法,以层层递进的方式,将前一层网络训练好之后再训练下一层,这种方法弱化了梯度消失的问题。近些年国内外对此有多种应用。
-
图2 RBM 结构
-
Fig.2 Structure of RBM
-
KAMAL 等[37]使用深度置信神经网络在航行体信号中提取深层次的不变性特征,相对于人工设计的传统特征提取方法更加稳定,在多种干扰源干扰的情况下,该深度置信网络在实例测试集上的分类识别正确率达到了 90.23%。王强和曾向阳[18] 使用 DBN 和 CNN 对实测水声数据进行特征提取和识别,并与传统的 SVM 分类识别 MFCC 特征作比较,其结果由于数据量的限制,三者相差不大,是水声学引入深度神经网络的一次尝试。近年来西北工业大学杨宏晖老师所在的团队对 DBN 也有研究[38-41]:在 DBN 中引入互信息分组策略结合而成的 MIGS-DBN 可以稀疏传统的 DBN 提取的特征,使模型更加简洁高效;在 CDBN 模型中,首先初始化的单元分组,然后在竞争层中获得隐层单元中特征较优的分组,从而实现了较少的特征与较高的正确识别率并存;此外,在竞争网络中再进行剪枝处理,将冗余的参数去除,再次提高了深度网络的效率。YUE 等[42-43]构建的 DBN 模型用于舰船辐射噪声的特征提取和识别,其分类结果的正确率达到了 96%以上。XIE 等[44]的深度玻尔兹曼机 (DBM)模型与 DBN 模型类似,也取得了优秀的特征提取效果,对水声信号的识别正确率在 90% 以上。在姚思冰的研究中[45],将测试样本的线谱特征、LOFAR 谱特征、MFCC 特征和 DEMON 谱特征分别作为 DBN 的输入,对水面目标进行识别,其总体识别率在 80%~90%。
-
综合国内外的研究来看,DBN 方法一方面可以依靠自身完整的深度网络结构提取目标特征并识别,也可以与传统特征提取方法相结合,处理传统方法预处理过的特征数据集,从文献的研究来看,其识别结果都比较优秀。
-
3.2 CNN 征提取
-
卷积神经网络最初是为了二维形状的识别而被设计出来的,对于图像类的特征提取与分类识别性能很好,同时也可以用于水下大型航行体的特征提取与鉴别。一般卷积神经网络都是多层的深度结构,其组成是输入层、多个卷积层和池化层交替连接、全连接层、输出层。其中的卷积层是卷积神经网络的核心,也是该种神经网络的主要特征,卷积层中有多个卷积核,来提取图像的多个特征,使卷积神经网络有更好的识别效果。现在的应用多为改进的卷积神经网络,研究者们根据不同的任务来设计相应的卷积网络结构。
-
王小宇等[46]将卷积层中的卷积核设为 1,并且以全局平均池化层(GAP)代替全连接层,可以把原始时域信号作为输入,更加突出目标信号的局部特征,而且提高了结果的可解释性。金磊磊等[47] 使用的卷积神经网络对声呐图像进行识别,他们将输入的数据先经过显著性分割处理,并且引入金字塔池化层(SSP),可以将输入数据的维数统一,声呐图像识别提高了便利性,并且有良好的准确性和实时性。WILLIAMS[48-49]使用深度卷积神经网络对合成孔径声呐图像进行分类识别,较传统的分类器有更卓越的性能。深度卷积神经网络在目前的水下目标识别方面已经是非常先进高效的特征提取和分类识别方法。PARK 等[50]以 CNN 模型处理声呐低频分析和记录(LOFAR)谱图,将 LOFAR 谱图分为晓得斑块来寻找其中的频率特征,从而实现快速、高精度的自动化识别船舶目标。
-
近五年,基于听觉感知的 CNN 特征提取模型展现出了很好的性能[51-56]。听觉感知模型模拟人耳对声音的感知过程,以原始声学信号作为输入,在 “耳蜗”部分由时间卷积层将输入信号进行初始化; 在“听觉皮层”部分,由置换层、能量池化层、二维频率卷积层、全连接层、全局平均池化层等将初始化的信号转换到频域,并且可以保留局部性特征并减少船舶噪声的频谱变化;最后通过目标函数对网络进行优化并分类识目标。文献[57]对传统卷积神经网络的卷积核特征提取方式进行改进,使提取的特征具有物理意义,增强了深度特征的可解释性。DOAN 等[58]也是将原始的时域信号作为输入,用深度 DNN 进行特征提取和识别,在 0 dB 的信噪比下对声呐数据的整体识别精度达到了 98.85%。此外,哈尔滨工程大学[17,59-61]、国防科技大学[43]、中国舰船研究院[62]、杭州电子科技大学[63]均对水下目标特征提取和分类识别的 CNN 模型有所研究。
-
CNN 还可以作为一个完整深度神经网络框架的一部分来发挥特征提取的作用。在文献[64]中, SONG 等提出了一种双路径循环神经网络模型,该模型的作用主要是实现水声信号的降噪处理,模型包括特征提取、模板分离和信号回复 3 个部分,其中特征提取部分就是使用的 CNN 来提取信号的高阶非线性特征并进行分块处理。
-
CNN 在各个领域的应用都极为广泛,从国内外的文献来看,在特征提取和目标识别领域,CNN 方法也是所有深度网络方法中应用最多的,这与其优秀的特征提取能力和识别精度、便于构建的网络结构密切相关。
-
3.3 RNN 特征提取
-
声音信号作为一种序列信号,是与时间有关的。RNN 对时间先后相关的数据集处理的能力极为优秀,它的结构特点是:隐层的输入不仅来自于显层,而且与隐层上一时刻的输出有关,RNN 可以让信息在网络中循环,在进行当前任务时调用以往的信息。
-
RNN 中有一种典型的网络结构是长短期记忆网络(Long Short Term Memory,LSTM)[65]。LSTM 网络改进了 RNN 时间跨度小,不能长期依赖的问题。在水声领域中,RNN 可以与 CNN 组合使用。 Das 等[66]将 LSTM 网络应用于水声传感器网络异常检测;MU 等[26]将 LSTM 网络引入 AUV 导航,比之前的方法有更好的精度和容错性;卢安安[17] 建立了多隐层的 DBLSTM 模型作为目标识别的主网络,可以保留有意义的梯度,这有利于水声目标识别。MU 和卢的研究中都证明了双向 LSTM 网络优于单向 LSTM 网络,卢的实验还证明了 LSTM 网络优于常规的 RNN 和 DNN。正因如此,LSTM 网络越来越受水声研究者的喜爱。KAMAL 等将 CNN 与双向长短时记忆网络(BLSTM)结合,可以减轻浅水声信号频谱–时间变量的影响[67-68]。ZHANG 等[69] 所使用的递归和卷积神经网络(R&CNN)由循环层、卷积层和全连接层组成,该深度神经网络结合 RNN 和 CNN 二者,提高了神经网络的自动提取特征能力和学习能力,在对比实验中的识别精度达到了最高,并且所消耗的平均时间也较少。
-
如今国内外用 RNN 处理水声低频特征提取和识别任务的研究比较匮乏,RNN 的设计是针对时间相关的信号,而时域的水声信号正是一种时间序列信号,因此在以后的研究中,可能会有越来越多的 RNN 方法应用于水下低频特征提取和识别中。
-
3.4 AE 神经网络特征提取
-
AE 神经网络也是水下大型航行体特征提取效果很好的一种神经网络。单个 AE 一般由编码器和解码器组成,经过编码和解码之后要求输出逼近输入。多个 AE 堆栈形成的栈式自编码器(SAE),也是一种深度结构。AE 神经网络可以无监督地提取特征,不需要已知的标签标注,因此在许多水下目标特征提取的场景中有许多优势。
-
国内外的研究中,CAO 等[70]建立的 SAE-softmax 模型利用堆栈稀疏 AE 神经网络提取航行体信号谱图中的深度特征,稀疏 AE 神经网络还可以提取其中隐藏的相关性特征,使用该 SAE-softmax 模型对三类真实水声目标进行分类识别,其正确识别结果均在 92%以上,整体识别率达到了 94.12%。在此基础上,CAO 等[71]将各个子带的轴频特征、高维对数功率谱特征(LPS)和小波包分量能量特征 (WPCE)联合构建多域特征,作为堆叠稀疏自编码器(SSAE)的输入,较单域特征更有优势。YANG 等[72]使用去噪 AE 和稀疏 AE 对水下接收信号的调制类型进行识别,在低信噪比的环境中可以保留较好的鲁棒性。SATHEESH 等[73]提出一种超参数的变分自编码器(β-VAE)的无监督生成框架,在航行体信号的分类识别中表现出优秀的成绩。陈卓[74]使用稀疏降噪 AE 对被动声呐数据进行特征提取,鞠东豪等[75]使用堆栈稀疏去噪 AE 训练特征提取神经网络,宋奎勇等[76]使用去噪 AE 和不同的降维方法进行特征级融合,这些研究展现了 AE 神经网络在水声数据的特征提取中强大的无监督处理数据的能力。
-
综上,AE 网络的深度模型常用的是 SAE,由多层编码器与解码器堆叠而成,在其中加入稀疏、去噪等功能较为常见,其强大的无监督提取特征的能力深受研究人员喜爱。
-
3.5 其他神经网络特征提取
-
在水声目标的特征提取领域,除了上述几种发展比较成熟的深度智能方法,还有 GAN 和迁移学习的新兴方法。二者相较于其他的深度模型,所需的数据量更小,是新兴的 2 种针对水下大型航行体特征的分析方法。
-
对于 GAN 模型,文献[77]以基于 GAN 的模型提取深层特征进行水声信号的识别实验,在低信噪比下的正确识别率可以达到 85%以上,较相同数据集训练的 CNN 模型更高。文献[78]将 self-attention 模块引入 GAN 模型,生成了高质量的 LOFAR 谱样本,在数据不足的情况下可以提高模型的准确度。文献[79]使用辅助分类器生成对抗网络(ACGAN),使用无监督学习的方式进行对抗训练,对从印度洋获取的水声数据进行分类识别实验,其结果较监督、非对抗式的对比模型更优。
-
对于迁移学习方法,JIN 等[80]通过 ImageNet 上大量的光学图像数据集迁移学习少量的声呐图像数据,实现了快速高效的声呐图像特征提取和识别。李俊豪等[81]提出了一种听觉感知的深度卷积网络(ADCNN)迁移模型,以已有的舰船辐射噪声大量数据训练该网络后,将特征参数迁移到小样本的识别任务中。实验表明:以迁移学习的方法较之前小样本识别的正确率提高了 4.17%。胡钢[82]、刘璐[83]研究的模型中,均是在大量 ImageNet 图像中训练出参数后,通过迁移学习引入水声领域,令原水声目标识别的准确率得到提高。
-
3.6 深度神经网络方法的局限性
-
深度神经网络对先验知识的依懒性不强,但是 DBN,CNN 和 RNN 想要发挥出优异的性能,对数据量及数据格式有较为苛刻的要求,这对于水下大型航行体特征而言是很难实现的,有时需要付出巨额的成本。而小样本的 GAN、迁移学习方法属于新兴的技术手段,还存在许多未知的挑战。对于迁移学习来说,所基于的大数据图像和所要实际分类的声呐图像之间的统计特征会有一定的区别,这样进行微调的时候缺乏跨域适应性,可能无法获得令人满意的迁移效果。
-
此外,智能方法中深度神经网络存在一种“黑箱”性质,这意味着不知道神经网络如何以及为何会得出一定的输出,在水下大型航行体远场低频特征提取问题中这是缺乏可解释性的,因此深度模型对水下航行体特征的识别结果往往并不能被完全信赖。
-
4 结束语
-
对于小样本的大型航行体远场低频特征提取问题,依靠大数据提高性能的深度网络在未来的应用中可能略显无力,而对于 GAN、迁移学习等对数据依赖不大的深度神经网络方法,在这些场景中可能会发挥出越来越重要的作用。使用累积数据训练好模型,再通过迁移学习的方法来解决新的小样本问题将成为未来水下大型航行体远场低频目标特征提取和识别的常用方法。对于深度神经网络方法的可解释性不足的问题,研究人员对此积极寻求解决方案,已经有学者初步提出将高维特征低维化,以获得可以解释的特征,这将是未来的一个研究方向。结合传统方法与智能方法各自的优点,将低维、高维特征相结合来共同构建水下大型航行体目标的特征表达,更有利于正确识别目标。未来,打破各种方法之间的壁垒,建立一种机器深度学习与专家系统、传统方法更深度融合的水下航行体低频特征鉴别机制,在水下大型航行体远场低频特征提取和目标识别任务中,有望改善各方法存在的不足。
-
参考文献
-
[1] 杨宏晖,徐光辉,李俊豪,等.被动水下目标识别研究进展综述[J].无人系统技术,2019,2(4):1-7.
-
[2] 蔡悦斌,张明之,史习智,等.舰船噪声波形结构特征提取及分类研究[J].电子学报,1999,27(6):129-130.
-
[3] 孟庆昕,杨士莪,于盛齐.基于波形结构特征和支持向量机的水面目标识别[J].电子与信息学报,2015,37(9):2117-2123.
-
[4] 吴国清,李靖,陈耀明,等.舰船噪声识别(Ⅱ)—— 线谱稳定性和唯一性[J].声学学报,1999(1):6-11.
-
[5] 赵建平,黄建国,谢一清,等.用小波变换进行水下回波边缘特征提取与分类识别[J].声学学报,1998(1):31-38.
-
[6] 卜英勇,张超,聂双双.基于离散小波变换的水下回波信号尾波包络特征提取[J].郑州大学学报:工学版,2007,28(4):80-83.
-
[7] 张静远,张冰,蒋兴舟.基于小波变换的特征提取方法分析[J].信号处理,2000,16(2):156-162.
-
[8] 郭雪松.基于小波变换的水下目标弹性散射提取方法研究[D].哈尔滨:哈尔滨工程大学,2015.
-
[9] CANG S Y,SHENG X L,DONG H,et al.Underwater acoustic echo time-frequency feature extraction and reconstruction using second-order synchrosqueezing transform[C]//Global Oceans 2020:Singapore – U.S.Gulf Coast.Biloxi:IEEE,2020.
-
[10] 朱世才.目标通过特性的LOFAR及 DEMON 分析[D].哈尔滨:哈尔滨工程大学,2011.
-
[11] CHO H J,LIM J S,KU B H,et al.Underwater radiated signal analysis in the modulation spectrogram domain[J].IEICE Transactions on Fundamentals of Electronics,Communications and Computer Sciences,2015,98-A(8):1751-1759.
-
[12] 杨阳.基于音色参量的声呐回波特征提取及分类[D].哈尔滨:哈尔滨工程大学,2012.
-
[13] 吴姚振.水下目标辐射噪声生理感知特征的提取方法研究[D].西安:西北工业大学,2015.
-
[14] ZHANG L J,HE B,SONG Y,et al.Underwater image feature extraction and matching based on visual saliency detection[C]//OCEANS 2016.Shanghai:IEEE,2016.
-
[15] NAGARAJA S,PRABHAKAR C J,KUMAR P U.Extraction of texture based features of underwater images using RLBP descriptor[C]//Proceedings of the 3rd International Conference on Frontiers of Intelligent Computing:Theory and Applications(FICTA).Odisha:Springer International Publishing,2015.
-
[16] LAANAYA H,MARTIN A,KHENCHAF A,et al.Knowledge discovery in databases for sonar images classification[J].Trait Signal,2008,25(1):55-71.
-
[17] 卢安安.基于深度学习方法的水下声音目标识别研究 [D].哈尔滨:哈尔滨工程大学,2017.
-
[18] 王强,曾向阳.深度学习方法及其在水下目标识别中的应用[C]//中国声学学会水声学分会2015年学术会议论文集.西安:中国声学学会水声学分会,2015,34(2):138-140.
-
[19] 章新华.水下目标自动识别的核心技术[J].兵工学报,1998,19(3):275-280.
-
[20] GHOSH J,DEUSER L M,BECK S D.A neural network based hybrid system for detection,characterization,and classification of short-duration oceanic signals[J].IEEE Journal of Oceanic Engineering,1992,17(4):351-363.
-
[21] 丁迎迎,杨永健,沈发江.RBF 神经网络在水下目标识别中的应用研究[C]//中国造船工程学会电子技术学术委员会.中国造船工程学会电子技术学术委员会2011年海战场电子信息技术学术年会论文集.舰船电子工程,2011:66-67,99.
-
[22] WARD M K,STEVENSON M.Sonar signal detection and classification using artificial neural networks[C]//2000 Canadian Conference on Electrical and Computer Engineering.Nova Scotia:IEEE,2000.
-
[23] BAHRAMI H,TALEBIYAN S R.Sonar signal classification using neural networks[J].International Journal of Computer Science Issues(IJCSI),2015,12(1):129-133.
-
[24] MCCLELLAND J L,RUMELHART D E.Distributed memory and the representation of general and specific information[J].Journal of Experimental Psychology General,1985,114(2):159-197.
-
[25] 程玉胜,李智忠,邱家兴.水声目标识别[M].北京:科学出版社,2018.
-
[26] MU X K,HE B,ZHANG X,et al.End-to-end navigation for autonomous underwater vehicle with hybrid recurrent neural networks[J].Ocean Engineering,2019,194:106602.
-
[27] 王菲.一种基于自适应遗传BP算法的神经网络目标分类器设计方法[J].自动化技术与应用,2007,26(12):80-82.
-
[28] ZHANG Q,BENVENISTE A.Wavelet networks[J].IEEE Transactions on Neural Networks,1992,3(6):889-898.
-
[29] BAKSHI B R,STEPHANOPOULOS G.Wavelets as basis functions for localized learning in a multi-resolution hierarchy[C]//International Joint Conference on Neural Networks.Baltimore:IEEE,1992.
-
[30] ZHANG J,WALTER G G,MIAO Y,et al.Wavelet neural networks for function learning[J].IEEE Transactions on Signal Processing,1995,43(6):1485-1497.
-
[31] SZU H H,TELFER B A,KADAMBE S L.Neural network adaptive wavelets for signal representation and classification[J].Optical Engineering,1992,31(9):1907-1916.
-
[32] ZHANG H,WAN L,SUN Y S.A new approach to underwater target recognition[C]//2nd International Congress on Image and Signal Processing.Tianjin:IEEE,2009.
-
[33] 李晓磊,钱积新.人工鱼群算法:自下而上的寻优模式[C]//中国系统工程学会过程系统工程专业委员会.过程系统工程2001年会论文集.北京:中国石化出版社,2001:83-89.
-
[34] 袁骏,张明敏,孙进才.基于PCA和 BP 神经网络的水下目标识别方法研究[J].海军工程大学学报,2005,17(1):101-104.
-
[35] HINTON G E,OSINDERO S,TEH Y W.A fast learning algorithm for deep belief nets[J].Neural Computation,2006,18(7):1527-1554.
-
[36] HINTON G E,SALAKHUTDINOV R R.Reducing the dimensionality of data with neural networks[J].Science,2006,313:504-507.
-
[37] KAMAL S,MOHAMMED S K,PILLAI P R S,et al.Deep learning architectures for underwater target recognition[C]//2013 Ocean Electronics(SYMPOL).Kochi:IEEE,2013.
-
[38] SHEN S,YANG H H,HAN Z H,et al.Learning robust features from underwater ship-radiated noise with mutual information group sparse DBN[C]//INTER-NOISE and NOISE-CON Congress and Conference Proceedings.Hamburg:Institute of Noise Control Engineering,2016.
-
[39] 杨宏晖,申昇,姚晓辉,等.用于水声目标特征学习与识别的混合正则化深度置信网络[J].西北工业大学学报,2017,35(2):220-225
-
[40] YANG H H,SHEN S,YAO X H,et al.Competitive deep-belief networks for underwater acoustic target recognition[J].Sensors,2018,18(4):1-13.
-
[41] SHEN S,YANG H H,SHENG M P.Compression of a deep competitive network based on mutual information for underwater acoustic targets recognition[J].Entropy,2018,20(4):243-255.
-
[42] YUE H,ZHANG L L,WANG D Z,et al.The classification of underwater acoustic targets based on deep learning methods[C]//2nd International Conference on Control,Automation,and Artificial Intelligence(CAAI 2017).Sanya:Atlantis Press,2017.
-
[43] 岳皓.基于深度学习的水声信号特征提取和分类识别研究[D].长沙:国防科技大学,2017.
-
[44] XIE J W,CHEN J,ZHANG J.DBM-based underwater acoustic source recognition[C]//2018 IEEE International Conference on Communication Systems(ICCS).Chengdu:IEEE,2018.
-
[45] 姚思冰.基于矢量声呐的水面目标识别及可视化软件的设计与实现[D].哈尔滨:哈尔滨工程大学,2021.
-
[46] 王小宇,李凡,曹琳,等.改进的卷积神经网络实现端到端的水下目标自动识别[J].信号处理,2020,36(6):958-965.
-
[47] 金磊磊,梁红,杨长生.基于卷积神经网络的水下目标声呐图像识别方法[J].西北工业大学学报,2021,39(2):285-291.
-
[48] WILLIAMS D P.Underwater target classification in synthetic aperture sonar imagery using deep convolutional neural networks[C]//23rd International Conference on Pattern Recognition(ICPR).Cancun:IEEE,2016.
-
[49] WILLIAMS D P.Transfer learning with SAS-image convolutional neural networks for improved underwater target classification[C]//2019 IEEE International Geoscience and Remote Sensing Symposium.Yokohama:IEEE,2019.
-
[50] PARK J H,JUNG D J.Identifying tonal frequencies in a Lofargram with convolutional neural networks[C]//19th International Conference on Control,Automation and Systems(ICCAS).Jeju:IEEE,2019.
-
[51] SHEN S,YANG H H,LI J H,et al.Auditory inspired convolutional neural networks for ship type classification with raw hydrophone data[J].Entropy,2018,20(12):990-1003.
-
[52] LI J H,YANG H H,SHEN S,et al.The learned multi-scale deep filters for underwater acoustic target modeling and recognition[C]//OCEANS 2019.Marseille:IEEE,2019.
-
[53] SHEN S,YANG H H,LI J H.Improved auditory inspired convolutional neural networks for ship type classification[C]//OCEANS 2019.Marseille:IEEE,2019.
-
[54] YANG H H,LI J H,SHEN S,et al.A deep convolutional neural network inspired by auditory perception for underwater acoustic target recognition[J].Sensors,2019,19(5):1104-1125.
-
[55] SHEN S,YANG H H,YAO X H,et al.Ship type classification by convolutional neural networks with auditory-like mechanisms[J].Sensors,2020,20(1):253-265.
-
[56] LI J H,YANG H H.The underwater acoustic target timbre perception and recognition based on the auditory inspired deep convolutional neural network[J].Applied Acoustics,2021,182:108210.
-
[57] 李俊豪,杨宏晖.用于水声目标信号时频特征提取与识别的深度卷积神经网络[J].无人系统技术,2019,2(4):26-30.
-
[58] DOAN V S,THIEN H T,KIM D S.Underwater acoustic target classification based on dense convolutional neural network[J].IEEE Geoscience and Remote Sensing Letters,2022,19:1-5.
-
[59] 顾正浩.面向水下目标识别的卷积神经网络优化方法研究[D].哈尔滨:哈尔滨工程大学,2018.
-
[60] 王念滨,何鸣,王红滨,等.基于卷积神经网络的水下目标特征提取方法[J].系统工程与电子技术,2018,40(6):1197-203.
-
[61] 郎泽宇.基于卷积神经网络的水下目标特征提取方法研究[D].哈尔滨:哈尔滨工程大学,2017.
-
[62] 程锦盛.基于深度学习方法的水下目标识别技术研究 [D].北京:中国舰船研究院,2018.
-
[63] 陈威.基于深度学习的声呐目标检测与识别[D].杭州:电子科技大学,2019.
-
[64] SONG Y Q,LIU F,SHEN T S.A novel noise reduction technique for underwater acoustic signals based on dual-path recurrent neural network[J].IET Communications,2022,17(2):135-144.
-
[65] HOCHREITER S,SCHMIDHUBER J.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780.
-
[66] DAS A P,THAMPI S M.Unsupervised anomaly detection in underwater acoustic sensor networks[J].Journal of Intelligent & Fuzzy Systems,2019,36(3):2367-2372.
-
[67] KAMAL S,CHANDRAN C S,SUPRIYA M H.Passive shallow water automated target recognition using deep convolutional bi-directional long short term memory[J].Defence Science Journal,2021,71(1):117-123.
-
[68] KAMAL S,CHANDRAN C S,SUPRIYA M H.Passive sonar automated target classifier for shallow waters using end-to-end learnable deep convolutional LSTMs[J].Journal of Engineering Science and Technology(JESTECH),2021,24(4):860-871.
-
[69] ZHANG W L,YANG X H,LENG C L,et al.Modulation recognition of underwater acoustic signals using deep hybrid neural networks[J].IEEE Transactions on Wireless Communications,2022,21(8):5977-5988.
-
[70] CAO X,ZHANG X M,YU Y,et al.Deep learning-based recognition of underwater target[C]//2016 IEEE International Conference on Digital Signal Processing(DSP).Beijing:IEEE,2016.
-
[71] CAO X,ZHANG X M,TOGNERI R,et al.Underwater target classification at greater depths using deep neural network with joint multiple-domain feature[J].IET Radar,Sonar and Navigation,2019,13(3):484-491.
-
[72] YANG H H,SHEN S,XIONG J,et al.Modulation recognition of underwater acoustic communication signals based on denoting & deep sparse autoencoder[C]//INTER-NOISE and NOISE-CON Congress and Conference Proceedings.Hamburg:Institute of Noise Control Engineering,2016.
-
[73] SATHEESH C C,KAMAL S,MUJEEB A,et al.Passive sonar target classification using deep generative β-VAE[J].IEEE Signal Processing Letters,2021,28:808-812.
-
[74] 陈卓.基于稀疏降噪自编码器的水声目标噪声数值特征提取方法[J].声学与电子工程,2020(4):7-10.
-
[75] 鞠东豪,李宇,王宇杰,等.基于堆栈稀疏去噪自编码器神经网络的舰船辐射噪声目标识别算法研究[J].振动与冲击,2021,40(24):50-56,74.
-
[76] 宋奎勇,周连科,王红滨.面向水下多源数据特征级融合方法[J].吉林大学学报:信息科学版,2021,39(3):331-338.
-
[77] 姚晓辉,杨宏晖,李益青.基于生成对抗网络的水声通信信号特征提取方法[C]//中国声学学会水声学分会.中国声学学会水声学分会2019年学术会议论文集.西安:中国声学学会水声学分会,2019:498-500.
-
[78] CHEN Y,LU H,YU J,et al.Improved method for generative adversarial nets[C]//2020 International Conference on Intelligent Computing and Human-Computer Interaction(ICHCI).Sanya:IEEE,2020.
-
[79] CHANDRAN C S,KAMAL S,MUJEEB A,et al.Generative adversarial learning for improved data efficiency in underwater target classification[J].Journal of Engineering Science and Technology(JESTECH),2022,30:101043.
-
[80] JIN L L,LIANG H,YANG C S.Accurate uderwater ATR in forward-looking sonar imagery using deep convolutional neural networks[J].IEEE Access,2019,7:2169-3536.
-
[81] 李俊豪,杨宏晖,申昇.用于水下目标识别的脑听觉感知迁移学习方法[C]//中国声学学会水声学分会.中国声学学会水声学分会2019年学术会议论文集.西安:中国声学学会水声学分会,2019:477-479.
-
[82] 胡钢.基于深度学习的水下目标识别和运动行为分析技术研究[D].哈尔滨:哈尔滨工程大学,2021.
-
[83] 刘璐.基于机器学习的水声目标识别技术研究[D].成都:电子科技大学,2021.
-
摘要
针对水下大型航行体的小样本远场低频特征提取与鉴别问题,从 3 个方面综述了目前国内外小样本低频特征提取与鉴别的传统方法和智能方法。时频域单独、时频域结合和视听感官特征提取的传统方法需要一定的先验知识与假设,易受环境干扰;专家系统、统计类方法和 BP 神经网络等早期的智能方法存在可移植性差、学习能力差、上限低、梯度消失等问题;深度置信网络(DBN)、卷积神经网络(CNN)、循环神经网络(RNN)、自编码器(AE)神经网络、生成对抗网络(GAN)、迁移学习深度网络等深度智能方法对先验知识依赖度低,可以提取深度不变特征,较其他方法更稳定,识别精度更高,但是也存在依赖数据量、可解释性不足的缺点。未来,传统方法与智能方法更深度的互补融合有望减少当前方法对数据量的依赖,提高深度特征的可解释性。
Abstract
Aiming at the problem of small-sample far-field low-frequency feature extraction and identification of large underwater vehicles,this paper reviews the traditional methods and intelligent methods of small-sample low-frequency feature extraction and identification at home and abroad from three aspects. The traditional extraction methods based on time-domain or frequency-domain features alone,time-frequency domain combination and audio/visual features require certain prior knowledge and assumptions,and are susceptible to environmental interference. Early intelligent methods such as expert systems,statistical methods and BP neural networks have problems such as poor portability,poor learning ability,low upper limit,and gradient vanishing. Deep intelligence methods such as deep confidence network(DBN),convolutional neural network(CNN),recurrent neural network (RNN),autoencoder(AE)neural network,generative adversarial network(GAN),and transfer learning deep network have low dependence on prior knowledge,and can extract deep invariant features,therefore,are more stable and have higher recognition accuracy than other methods. However,they also have the disadvantages of relying on the amount of data and insufficient interpretability. In the future,the deeper complementary integration of traditional methods and intelligent methods is expected to reduce the dependence of current methods on data volume and to improve the interpretability of deep features.