摘要
海豚是一种鲸目哺乳动物,它具有发达的声呐系统。传统的海豚声信号识别需要从采集的大量海豚发声数据中,利用人工的方法提取海豚声信号,这种方法非常耗时耗力。由于海豚的回声定位信号(Click)是一种单一的脉冲信号,并且不同海豚的回声定位信号存在差异,因此可以利用海豚的Click信号进行海豚种类识别。另外,传统的海豚种类识别需要通过视觉观察,难以在海豚检测网络中实时识别海豚种类以及跟踪海豚。近年来关于机器学习方法的研究日益增多,该方法可以用于数据的分类和预测。因此本研究以海豚回声定位信号和海豚图像分别为识别依据,使用机器学习方法进行海豚种类的自动识别。 本文首先以海豚回声定位信号为识别依据,使用五种机器学习方法识别海豚种类。实验中,将厦门湾的中华白海豚和雷州湾的中华白海豚设为第一组,进行相同种类的海豚识别;将厦门湾的中华白海豚和宽吻海豚设为第二组,进行不同种类的海豚识别。首先计算海豚声信号时频图,并进行自适应阈值和连通域分析判断Click信号大致位置;其次使用Teager-Kaiser能量算子(TKEO)和Gabor滤波器精确定位Click信号位置;然后通过倒谱的方法提取Click信号的特征;最后利用五种机器学习方法识别海豚种类。实验结果表明第一组和第二组的平均识别准确率分别为99%和96%以上。 接着针对第一组相同种类海豚识别,提出一种基于卷积神经网络的方法识别海豚种类,并讨论了卷积神经网络中参数的最佳选择。当使用1或3的卷积核大小不适合海豚Click信号的分类,分类准确率较低;当使用9或11的卷积核大小分类效果好,测试识别准确率可以达到99.75%。针对第二组不同种类海豚种类识别,提出了一种基于Xgboost的方法提高不同种类海豚的识别准确率,结果表明该方法的识别准确率可以提高到99%以上。 论文最后以海豚图像为识别依据,使用卷积神经网络的方法识别海豚种类。实验中首先利用爬虫技术从互联网络上获取海豚图像;然后利用SSD模型对海豚图像进行目标检测;接着通过比较不同训练集比例的识别效果、数据集扩大前后的识别效果,以及三种模型(AlexNet、VGGNet、ResNet)分别的识别效果;最终选择了训练集的切割比例为90%、通过图像镜像翻转扩大数据集,使用ResNet模型进行海豚图像识别。该模型的训练准确率为97.94%,测试准确率为93.06%。 本研究表明,机器学习方法能够分析采集的海豚发声信号和海豚图像,对保护区的海豚进行自动识别与检测,从而可以更好的研究和保护海豚。