三维点云目标分类与语义分割算法研究

李珂¹

扫码查看

作者信息

1. 北京工业大学
折叠

摘要

激光传感器、三维扫描技术的快速发展为自动驾驶、机器人等领域的发展研究提供了支撑。同时，三维点云数据的海量增加以及点云数据固有的无序性、不规则性等特点，为三维点云目标分类、语义分割等研究领域带来了巨大的挑战。本文研究三维点云目标分类与语义分割问题，结合图卷积、多层级编码解码机制、空间注意力机制等，完成了如下工作: 1、针对三维点云目标分类任务，三维点云数据具有不规则性、非结构化性，且对于任意给出的点云节点，每个节点的出度和入度可能不一样，查找的邻近点可能包含在不同大小的局部区域内，会导致特征冗余的问题，提出了基于多层次图卷积的点云分类网络。该网络通过多视野投影，将点云的区域密度列入衡量标准，逐渐扩大感受野合并相似节点，使得局部区域内的点云更为均匀，达到了减少特征冗余的目的。并结合残差块和边缘图卷积进行特征提取，增加了特征跨层传输的能力，提高了分类网络的鲁棒性。 2、针对三维点云语义分割任务，常用的PointNet网络进行语义分割任务时未考虑局部特征，且对细粒度特征提取不够完整的问题，提出了基于多层级编码解码的点云语义分割网络。该网络使用分组策略，将点云数据分成若干个多层级局部区域，使用共享编码器对局部区域编码，并通过反距离插值、跳跃跨层连接和反卷积策略进行全局解码和局部解码。多层级编码解码的方式增强了细粒度的特征提取的能力，为完成语义分割任务提供了良好的支持。 3、针对三维点云语义分割任务如何更有效地考虑物体的空间结构特征，本文引入空间结构特征权重，提出了基于空间注意力机制的点云语义分割网络。该网络使用球查询分组，通过核密度估计法改进特征提取的方式，并引入空间注意力机制，在独立卷积过程中保留原始点云的空间结构信息，得到了相对丰富的空间结构特征，提高了点云语义分割网络的鲁棒性。基于上述工作，本文在三维点云数据集ModelNet40、ShapeNet、S3DIS上进行实验。其中，在ModelNet40数据集上分类总体准确率达到了92.5％,高于PointNet++、DGCNN、Softpollnet等网络，在ShapeNet和S3DIS数据集上，平均交并比分别达到了86.1％和63.0％,分割效果好于PointNet++、DGCNN等网络。

关键词

语义分割/深度学习/卷积神经网络/三维点云/注意力机制

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

王丹

学位年度

2023

学位授予单位

北京工业大学

语种

中文

中图分类号

段落导航