基于激光雷达和相机的环境感知融合算法研究

韩闯闯¹

扫码查看

作者信息

1. 吉林大学
折叠

摘要

随着科学技术的飞速发展，自动驾驶逐渐成为交通发展的新趋势。自动驾驶车辆的应用前景包括提升交通安全、缓解交通压力等多个层面，它将为我们的出行方式带来革命性的变化。在自动驾驶系统中，自动驾驶可以分为感知，决策，控制等几个模块，而感知作为自动驾驶的最基础以及最前端的层面，无疑是起着先决性作用的，感知做不好，那么后面的决策层以及控制层更是无从说起，所以环境感知功能的重要性不言而喻，它是实现车辆自主导航的核心环节。通过各类传感器，车辆能够对路况和周围环境进行实时监测，并据此做出准确的驾驶决策。然而，仅依赖单一类型的传感器的传统感知系统往往难以全面捕捉复杂的交通环境。单模态感知系统的局限性可能会导致信息的不完整和解读错误，进而影响自动驾驶汽车的安全运行。为了克服这些局限并增强感知能力，感知融合技术应运而生，并迅速在自动驾驶领域得到了广泛应用。感知融合技术通过整合多种传感器的数据，使得各种信息能够相互补充和校正，有效降低了依赖单一传感器时的误差风险。通过这种综合的信息处理，自动驾驶车辆能够获得更为全面和可靠的环境感知结果，显著提高车辆的自主驾驶安全性。为探索如何提升自动驾驶系统在复杂环境中的感知能力，本文围绕基于激光雷达（LiDAR）和相机的决策级融合技术，进行了深入的算法研究，旨在增强自动驾驶汽车的环境感知准确性和响应速度。本研究的主要工作内容包括：（1）基于YOLOv7算法的改进：为了应对预测框与真实框之间角度不匹配和比例不一致的问题，本文在原始的YOLOv7算法中引入了SIoU损失函数。该函数在原有损失计算基础上增加了角度的考量，使得损失函数不仅衡量重叠区域的大小，同时也考虑了形状和方向的匹配程度，目的是在更复杂的检测任务中提高模型的精度。为了解决局部与全局信息不平衡的问题，本文又在YOLOv7中引入了感受野块（ReceptiveFieldBlock,RFB）模块。RFB通过多尺度的感知野设计，目的是增强网络对于不同尺度目标的捕捉能力。针对传统的非极大抑制（NMS）在处理高重叠区域的检测框时可能会导致漏检的问题，本文采用了Soft-NMS这种更为灵活的抑制策略，它通过降低重叠检测框的置信度而不是直接去除，目的是提高模型在拥挤场景下的检测能力和准确率。（2）基于CenterPoint算法的改进：本文基于原始的CenterPoint算法加入了CBAM（ConvolutionalBlockAttentionModule）这种特征增强机制，可以有效提炼关键信息并抑制无关噪声。通过对空间和通道两个维度的信息进行综合考虑，CBAM能够加强网络对关键特征的学习，进而提升对图像细节的理解和解读。为了更精准地识别不同尺度和形态的目标，本文在CenterPoint的检测头部分引入了可变形卷积层（DeformableConvolutionalLayers）。这种卷积层能够适应目标的具体形态，通过可学习的偏移量，对卷积核的采样位置进行动态调整。这样设计的目的是使得网络不仅在标准的目标形状上表现优秀，对于非标准或者不规则的目标形状也能捕捉其特征。（3）基于CLOCs算法的改进：由于IoU（交并比）在处理分散的候选框时可能会产生零值，而在多传感器融合目标检测网络中候选框的分布往往更为分散，以及输出数量相比单一传感器可能更少，使得这就使得IoU值更有可能为0，为此本研究引入了GIoU（广义交并比）作为新的度量标准。GIoU不仅考虑了候选框之间的重叠面积，还涉及了它们之间的几何关系，即使在没有重叠的情况下也能提供有意义的反馈。这种方法可以有效减少重复检测，并提高检测的准确度，在处理高度分散的候选框时更为有效。在传统CLOCs算法中，通常仅使用有限的特征来表示两种模态数据之间的关系。本文提出加入新的融合特征——dlc，它增加了网络对特征的冗余度，使得算法能够更全面地捕获和理解两种模态之间的复杂交互。这种新的特征有助于提高多模态数据融合的质量和效果，尤其是在处理具有丰富场景交互的复杂环境时。

关键词

自动驾驶/环境感知/多传感器/激光雷达/相机

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

王健

学位年度

2024

学位授予单位

吉林大学

语种

中文

中图分类号

段落导航