基于机器学习的海豚种类识别研究

王宸¹

扫码查看

作者信息

1. 厦门大学
折叠

摘要

海豚是一种鲸目哺乳动物，它具有发达的声呐系统。传统的海豚声信号识别需要从采集的大量海豚发声数据中，利用人工的方法提取海豚声信号，这种方法非常耗时耗力。由于海豚的回声定位信号(Click)是一种单一的脉冲信号，并且不同海豚的回声定位信号存在差异，因此可以利用海豚的Click信号进行海豚种类识别。另外，传统的海豚种类识别需要通过视觉观察，难以在海豚检测网络中实时识别海豚种类以及跟踪海豚。近年来关于机器学习方法的研究日益增多，该方法可以用于数据的分类和预测。因此本研究以海豚回声定位信号和海豚图像分别为识别依据，使用机器学习方法进行海豚种类的自动识别。本文首先以海豚回声定位信号为识别依据，使用五种机器学习方法识别海豚种类。实验中，将厦门湾的中华白海豚和雷州湾的中华白海豚设为第一组，进行相同种类的海豚识别;将厦门湾的中华白海豚和宽吻海豚设为第二组，进行不同种类的海豚识别。首先计算海豚声信号时频图，并进行自适应阈值和连通域分析判断Click信号大致位置;其次使用Teager-Kaiser能量算子(TKEO)和Gabor滤波器精确定位Click信号位置;然后通过倒谱的方法提取Click信号的特征;最后利用五种机器学习方法识别海豚种类。实验结果表明第一组和第二组的平均识别准确率分别为99％和96％以上。接着针对第一组相同种类海豚识别，提出一种基于卷积神经网络的方法识别海豚种类，并讨论了卷积神经网络中参数的最佳选择。当使用1或3的卷积核大小不适合海豚Click信号的分类，分类准确率较低;当使用9或11的卷积核大小分类效果好，测试识别准确率可以达到99.75％。针对第二组不同种类海豚种类识别，提出了一种基于Xgboost的方法提高不同种类海豚的识别准确率，结果表明该方法的识别准确率可以提高到99％以上。论文最后以海豚图像为识别依据，使用卷积神经网络的方法识别海豚种类。实验中首先利用爬虫技术从互联网络上获取海豚图像;然后利用SSD模型对海豚图像进行目标检测;接着通过比较不同训练集比例的识别效果、数据集扩大前后的识别效果，以及三种模型(AlexNet、VGGNet、ResNet)分别的识别效果;最终选择了训练集的切割比例为90％、通过图像镜像翻转扩大数据集，使用ResNet模型进行海豚图像识别。该模型的训练准确率为97.94％，测试准确率为93.06％。本研究表明，机器学习方法能够分析采集的海豚发声信号和海豚图像，对保护区的海豚进行自动识别与检测，从而可以更好的研究和保护海豚。

关键词

海豚种类/声信号识别/图像识别/机器学习/卷积神经网络

引用本文复制引用

授予学位

硕士

学科专业

海洋物理

导师

陶毅

学位年度

2020

学位授予单位

厦门大学

语种

中文

中图分类号

段落导航