摘要
由于人类的滥杀滥捕以及对野生动物生存环境的破坏,导致藏羚羊的数量急剧减少濒临灭绝,为了保持生物多样性、维护生态平衡以及抗高寒动物基因研究,国家野生动物保护局将藏羚羊列为一级保护动物,并在可可西里建立保护区。现在保护站对藏羚羊的数量统计主要是人工计数的方式,然而藏羚羊主要生活在环境恶劣的可可西里等高寒地区,对工作人员展开工作十分不利,造成统计的准确性大大降低,给研究和保护工作造成巨大的困扰。针对以上问题,本课题以藏羚羊为研究目标,以图像处理为基础,利用可可西里环境下的藏羚羊监控视频数据,建立藏羚羊目标检测、跟踪、骨架识别数据库,以深度学习理论知识为基础构建针对藏羚羊图像数据的神经网络来完成对藏羚羊的检测与跟踪。本文主要完成以下工作: (1)为课题研究的需求,利用获取的藏羚羊监控视频数据,将实验室原有的藏羚羊图像检测数据库从3500帧图像扩充到10000张图像,标记藏羚羊数185857只;建立藏羚羊目标跟踪数据库,其中包括主视、侧视、俯视三个不同视角,晴天、多云、阴天三种不同天气,静止、慢行、奔跑三个不同状态下的藏羚羊视频序列段十二个,14860帧图像;建立藏羚羊姿态识别数据库,其中包括800帧不同环境、状态、视角的图像,藏羚羊共25616只,每只藏羚羊标记14个关键点。 (2)在藏羚羊检测方面,采用特征金字塔网络结构来提高模型对小目标特征的学习能力和检测精度;采用onestage网络结构模型来提高网络的检测速度;通过优化网络的损失函数来提高网络模型对数据较少类别的检测精度,增强模型的泛化能力;通过在网络模型中增加额外的有监督学习分支来进一步提高模型对密集藏羚羊目标的检测性能,实验结果表明,在合理的时间消耗下,有监督分支可以进一步提高模型的检测精度。 (3)在藏羚羊跟踪部分,将本文检测网络的检测结果作为DeepSort跟踪算法的输入完成藏羚羊跟踪工作。利用卡尔曼预测模型对目标的运动状态进行预测,匈牙利匹配算法完成目标匹配;在匹配中引入余弦度量距离来解决目标长时间遮挡问题,使平均ID跳变降低35.1%。