基于深度学习的微塑料光谱重建识别及对应软件开发

刘彦龙¹

扫码查看

作者信息

1. 兰州大学
折叠

摘要

随着塑料制品的广泛应用，排放到环境中的塑料逐渐增加，由于其稳定的化学性质以及目前尚不明确的污染物协同机理，环境中的塑料逐渐成为一种难以处理的污染物。微塑料自从2004年被提出以来，逐渐成为一种备受关注的新兴污染物。大块的塑料废弃物带来的污染是可见的，微塑料由于其小颗粒的特点，难以直观地被观察到，因此可能具有更加复杂的污染情况。在微塑料的监测管理标准制定之前，积累足够的相关技术十分必要，而分类与识别是其中的基础部分，其目标是尽可能准确地确定目标塑料的种类与数量等信息，这很好地契合了深度学习的许多任务，即分类任务以及图像分割与目标提取。因此，本研究结合深度学习来进行微塑料的识别与分类。首先，本研究基于深度学习进行了多至120种混合塑料的红外光谱建模以及识别。本研究测试了共计超过170个标准样品和70个环境样品的红外光谱，建立了常用塑料种类的光谱数据集。选择一维与二维卷积神经网络(CNN1D、CNN2D)搭建了微塑料分类模型，其输入分别是原始光谱数据和对应光谱图像。同时，选择决策树(Decision Tree, DT)与随机森林(Random Forest, RF)进行对比。结果表明，CNN1D在小数据集与大数据集上分别达到gt;96%与97%的准确率，优于其它模型。在数据量不足的情况下，对环境样品的预测结果显示RF与CNN2D的泛化性能较好，这可能是由于环境样品中存在添加剂、经历风化作用和噪音等，导致其光谱与标准样品光谱差距较大，而 CNN1D 对数据集学习效果更好或有一定的过拟合情况，进而导致泛化性能降低。对于 CNN2D 来说，其输入数据是图像而非原始光谱数据，因此即使添加了部分干扰对其影响也较为有限。当数据量增加，CNN1D的泛化性能得到了提升，在大数据集上，CNN1D对环境样品的预测准确率高于其它模型，这可能是由于数据量的增加缓解了CNN1D的过拟合现象。同时，RF与CNN2D对环境样品的预测准确率也有所增加，RF的表现与CNN1D比较接近。基于上述结果，当数据量较小时推荐RF或者CNN2D来进行识别分类，这通常是针对不常见的塑料种类；常见的塑料种类例如聚乙烯等数据量较大，此时CNN1D是最优选择。其次，为进一步提高模型在环境样品数据集中的效果，本研究使用了24种单组分塑料，搭建并训练了基于自编码器(AE)与卷积神经网络(VCNN)的两个光谱重建模型，并使用DT、RF、线性支持向量机(LSVM)与CNN1D四个分类模型对重建前后的数据集进行了分类评价。结果显示，VCNN的重建效果优于AE，其信噪比与决定系数分别达到16与0.96，但稳定性较AE差，二者均优于Savitzky-Golay滤波算法。在原始数据集上，LSVM展现出最好的分类准确率，为97.38%，CNN1D次之，为96.02%。在AE重建数据集上，除DT准确率有所提升外，其余模型均有所下降，这一方面是因为重建特征并未包含进训练数据中，另一方面 AE 的重建效果较差，为数据集添加了额外的干扰。在VCNN重建数据集上，各模型的准确率均有所提升或表现相近，这是因为其重建效果较好。当加入重建特征后各模型在AE重建集、VCNN重建集上的准确率均有所提高，证明了上述猜想，同时说明数据经 AE 重建产生了新的数据特征，在联合分类模型使用时应予以考虑。在实际数据集上，相较于混合分类模型，单种类塑料分类模型的top-1准确率从最高不到20%提升到了最高约70%，证明了混合种类是影响模型在实际数据集上准确率的重要因素。同时，受数据集不平衡、数据增强方法以及实际数据集自身限制，大部分模型在重建数据集上的准确率有所降低，因此需要进一步探究更加符合环境样品数据特征的增强与归一化方法。最后，基于上述开发的模型，本研究同时开发了对应的图形界面程序，即微塑料光谱分析软件(mPSAT)，旨在帮助简化微塑料的识别分类过程，同时为对本研究感兴趣的研究人员提供一个使用范例。

关键词

环境监测/微塑料/光谱重建/软件开发

引用本文复制引用

授予学位

硕士

学科专业

资源与环境(环境工程)

导师

郑易安/张静

学位年度

2023

学位授予单位

兰州大学

语种

中文

中图分类号

段落导航