摘要
激光传感器、三维扫描技术的快速发展为自动驾驶、机器人等领域的发展研究提供了支撑。同时,三维点云数据的海量增加以及点云数据固有的无序性、不规则性等特点,为三维点云目标分类、语义分割等研究领域带来了巨大的挑战。本文研究三维点云目标分类与语义分割问题,结合图卷积、多层级编码解码机制、空间注意力机制等,完成了如下工作: 1、针对三维点云目标分类任务,三维点云数据具有不规则性、非结构化性,且对于任意给出的点云节点,每个节点的出度和入度可能不一样,查找的邻近点可能包含在不同大小的局部区域内,会导致特征冗余的问题,提出了基于多层次图卷积的点云分类网络。该网络通过多视野投影,将点云的区域密度列入衡量标准,逐渐扩大感受野合并相似节点,使得局部区域内的点云更为均匀,达到了减少特征冗余的目的。并结合残差块和边缘图卷积进行特征提取,增加了特征跨层传输的能力,提高了分类网络的鲁棒性。 2、针对三维点云语义分割任务,常用的PointNet网络进行语义分割任务时未考虑局部特征,且对细粒度特征提取不够完整的问题,提出了基于多层级编码解码的点云语义分割网络。该网络使用分组策略,将点云数据分成若干个多层级局部区域,使用共享编码器对局部区域编码,并通过反距离插值、跳跃跨层连接和反卷积策略进行全局解码和局部解码。多层级编码解码的方式增强了细粒度的特征提取的能力,为完成语义分割任务提供了良好的支持。 3、针对三维点云语义分割任务如何更有效地考虑物体的空间结构特征,本文引入空间结构特征权重,提出了基于空间注意力机制的点云语义分割网络。该网络使用球查询分组,通过核密度估计法改进特征提取的方式,并引入空间注意力机制,在独立卷积过程中保留原始点云的空间结构信息,得到了相对丰富的空间结构特征,提高了点云语义分割网络的鲁棒性。 基于上述工作,本文在三维点云数据集ModelNet40、ShapeNet、S3DIS上进行实验。其中,在ModelNet40数据集上分类总体准确率达到了92.5%,高于PointNet++、DGCNN、Softpollnet等网络,在ShapeNet和S3DIS数据集上,平均交并比分别达到了86.1%和63.0%,分割效果好于PointNet++、DGCNN等网络。