从2019年至今,我们接触到了各式各样的声音检测需求,市场上关于声音检测的需求不断,甚至很多工厂都把声音检测纳入的标准检测规范之中,声音检测的应用也在逐渐普及。因此这里我们想简单的介绍下目前很火的声音检测技术。
在介绍之前,我们需要把声音检测技术与语音识别,声纹识别加以区分。从声音特性角度来看,声音可以划分为语音,音乐与环境声三大类,而目前主流的语音识别及声纹识别技术都是针对语音信号处理的,技术发展的相对成熟,而我们所提到的声音检测技术则主要是针对环境声的,包括城市交通,工厂噪声,自然环境声等等,整体技术还处于早期发展阶段,虽不够成熟,但是在应用方面还是有广阔的发展空间的。
计算机听觉
其实声音检测技术是从属于计算机听觉学科的分支。
近10年来,随着半导体技术,互联网,音频压缩技术,录音设备的共同发展,使得数字格式的各种声音急剧增加。在人类听觉机制的启发之下,诞生了一个新的学科——计算机听觉,也可以成为机器听觉。计算机听觉是一个面向数字音频与音乐,研究用计算机软件来分析和理解海量数字音频内容的算法与系统的科学。
通俗来讲,计算机听觉的目的是让计算机或者机器能具备人类的听觉感知能力。是不是并没有很难理解?
计算机听觉的核心功能
为了模拟人类能够通过声音特性产生主观感受的能力,计算机听觉的要实现的核心功能主要是如下三点:
1、 声音检测/音频事件检测(audio event detection)
2、 声目标识别(acoustic target detection)
3、 声源定位(Sound source location)
下图就展示了计算机听觉的基本框架

其中声源定位我们前几篇文章也有过初步的介绍,声目标识别更为复杂,后期会加以介绍,今天我们主要介绍声音检测/音频事件检测技术。
声音检测/音频事件检测(AED)也叫做声音事件检测,环境声音检测,主要目的是检测连续的音频流之中有无出现目标声音事件,比如检测设备故障异常发出的声音,事故现场发出的声音,野生动物的声音等等。类比人类,机器可以用过聆听周边环境的声音判断发生了什么,如果说语音识别是将我们人类语音翻译为机器能听懂的语言,那么环境声音检测技术就是将环境声音翻译为机器可以理解的声音。只不过在实际实现的过程中,各种背景噪声干扰同时存在,针对环境声的检测相比语音识别会更加复杂与困难,所以也导致语音识别技术发展相对较早较为成熟,但是随着近些年城市智慧化建设的需要,与工厂自动化升级的推动,声音检测技术也在快速完善。
应用
声音检测技术最早用在哪?和声源定位一样,都是用在军事领域,最早用于进行声呐探潜,在海洋里利用声音探测潜水艇及舰船的螺旋桨噪声作为检测手段,判断敌情。当然至今这一技术仍是海洋里最为普遍可靠的技术方案。
近些年,该技术逐渐在民用领域快速发展,在各个领域都有广泛应用。
下面主要为大家介绍一下我们公司的部分应用案例
皮带机异响检测
通过在皮带机周围安装空气声呐模块,声呐模块可以实时检测皮带机工作时的噪声情况,一旦出现托辊异常产生的异响,系统则会实时预警处理。

抽油泵异常检测
通过在抽油泵周边安装声呐模块,可以实时对抽油泵的工作状态噪声进行检测,一旦设备本身的噪声状态发生变化,系统可以实时检测预警。

机器人巡检
通过在巡检机器人上面搭载声呐模块,系统可以随机器人的移动实时进行噪声检测,实现移动巡检。

以上几点也只是声音检测技术民用的冰山一角,还有广阔的应用前景与空间。
近几年国外也越来越重视这项技术的发展与应用,包括世界名校,谷歌等行业巨头也争相加入这一领域的研究。声音检测相关研究赛事也越来越多,其中最有代表性的是由多家世界百强高校(包括纽约大学,坦佩雷大学,伦敦玛丽皇家学院等)联合承办的声音场景与事件检测分类挑战赛(Detection and Classification of Acoustic Scenes and Events),这一赛事目前仅举办到第五届,便吸引了国际上大量的高水平研究学者的参与,我们公司也在19年参与其中(在2019城市环境声音分类赛中F-score国际第一),同时也收获了丰富的积累。