近期,2022海洋探测与环境效应国际学术会议(ICODEE)于2022年11月20日顺利完成,因疫情原因,此次会议在线上召开。西工大航海学院-迅声环境声音感知联合实验室(JLESS)张董哲、白吉生、李晓强、王谋、Muhammad Saad Ayub五位成员在实验室主任以及航海学院教授陈建峰老师的带领下积极参与了此次会议。
2022海洋探测与环境效应国际学术会议(ICODEE 2022)是由国防科技大学主办,西北工业大学、自然部第二海洋研究所、哈尔滨工程大学、中山大学、中科院声学研究所、重工船舶集团、厦门大学共同协办以及国防科技大学气象海洋学院承办。
会议旨在汇集顶尖的学术科学家、研究人员和研究学者,交流和分享他们在海洋传感和海洋声学各个方面的经验和研究成果。它还为研究人员、从业者和教育工作者提供了一个重要的跨学科平台,以展示和讨论海洋传感和海洋声学领域的最新创新、趋势和关注点,以及遇到的实际挑战和采用的解决方案。此次会议的范围和主题主要包含五个方面:海洋传感、海洋声学、声信号处理、海洋环境与声波层析成像法和水下通信网络。

此次会议,由实验室成员张董哲主讲,所汇报内容主题为“基于深度学习的声呐阵列与定位方法研究”。主要从DOA估计简介、水声场景研究和空气声场景研究三方面进行了汇报。

在此汇报当中,张董哲首先分析了基于信号处理的DOA估计的现状及各种传统算法的优缺点,进而引出了基于深度学习的DOA估计方法。
基于深度学习的DOA估计方法,旨在通过仿真构造阵列接收信号数据集,并基于数据通过神经网络进行DOA估计。

如何选择特征?
实验室研究发现,信号的直接特征例如短时傅里叶变换谱(STFT)、梅尔谱(Mel spectrogram)等可以更直接保留信号原始信息,但是数据量较大;而信号抽象特征例如阵列协方差矩阵(Covariance matrix)、广义互相关矩阵(Generialized cross-correlation matrix)等具有数据量小、且可借助传统信号处理算法的优点,但同时也损失了部分原始信息。
如何选择模型?
在网络模型方面,实验室成员搭建了CNN、CRNN、Residual-CRNN等多种网络模型,并根据所构建的训练架构进行水声DOA估计仿真实验。核心思路是将把[-70,70]范围内的入射角分成141个类别,从而将DOA估计问题转化为分类问题。

实验结果
实验结果表明,实验室所提出的CRNN方法相比于传统DOA算法以及其他基于深度学习的DOA方法具有更好的DOA估计精度,在低信噪比下也能达到很好的效果。

从水声场景的DOA估计仿真结果来看,可尝试将应用拓展到空气中,如室内说话人定位、声音事件检测与定位等,通过分布式阵列定位目标,得到目标的方向和位置,将多目标定位问题转化为多标签分类问题,以端到端的方式进行模型训练,最后以获得DOA的结果。
总结 CONCLUSION
团队成员试着将DOA估计从传统走向智能、从水声拓展到空气声,并为之不懈努力。作为一名科研工作者,最需要的便是钻研精神,脚踏实地去攻坚克难,正如习近平总书记所说“道阻且长,行则将至;行而不辍,未来可期。前方的路会有曲折,但也充满希望。”