深度学习中的三维点云数据分类算法研究

翟睿峰¹

扫码查看

作者信息

1. 吉林大学
折叠

摘要

随着三维传感器技术的发展，如何有效的处理三维点云数据已经成为一个新的研究热点。点云是三维世界中物体表面几何形状的采样，它以离散三维坐标的形式描绘物体在空间的位置以及三维信息。点云分类算法广泛应用于自动驾驶、虚拟现实、增强现实、3D人脸识别、SLAM和遥感测绘等领域。其中自动驾驶的车辆常常使用LiDAR作为传感器获取周边点云数据，点云分类算法赋予原始点云的语义信息有助于车辆行驶速度的调整和行驶方向的选择。近年来基于深度学习的点云数据分类技术在模拟点云数据上取得了长足的发展，但在具有噪声和背景的真实点云数据的分类任务上仍是一个具有挑战的问题。首先，本文探讨了如何将孪生网络框架与点云分类网络PointNet相结合。基于孪生神经网络的点云分类框架要求同时输入两个点云数据。对于同时输入的两个点云数据，网络多次使用权值共享的逐点多层感知器提取它们的局部特征。接着使用最大池化函数实现全局信息的提取，得到两个点云的全局特征。使用特征重组函数处理两个点云的全局特征，对于具有相同类别的点云，特征重组函数会保留拥有相似激活值的特征，衰减差异较大的激活值特征；对于具有不同类别的点云，特征重组函数会保留拥有不同激活值的特征，衰减差异较小的激活值特征。最后使用全连接网络实现分类任务。其次，本文解决了基于孪生网络的点云分类框架存在的问题，提出了一种双输入网络框架。双输入网络框架与孪生网络框架类似，同样要求同时输入两个点云数据。双输入网络框架使用拥有特征提取功能的神经网络提取点云的信息，使用具有特征分析能力的神经网络分析点云的特征，使用特征比较器处理在特征提取器与特征分析器之间的特征向量。特征比较器在高维空间内实现了同种类别点云的聚类，拉近了同种点云之间的距离，拉远了异种点云之间的距离。在双输入网络框架的应用上，本文分别介绍了PointNet网络和PointCNN如何在双输入网络框架下应用及其结果。最后，本文对比了DILoss与FaceNet中TripletLoss损失函数的异同，理论分析和实验结果表明DILoss更适合应用于实现分类任务的双输入网络框架。拥有双输入网络框架结构的DI-PointNet和DI-PointCNN在模拟数据集和真实数据集实验结果表明，双输入网络框架提高了原网络的鲁棒性，排除了部分背景噪声的干扰，适用于真实点云数据。DI-PointCNN在公开模拟点云数据集ModelNet40的平均准确率和总体准确率分别为88.3%和92.1%，在公开真实点云数据集ScanObjectNN的平均准确率和总体准确率分别为79.6%和81.3%。

关键词

深度学习/三维点云/激光雷达/语义分类

引用本文复制引用

授予学位

硕士

学科专业

电路与系统

导师

郭树旭

学位年度

2021

学位授予单位

吉林大学

语种

中文

中图分类号

段落导航