首页期刊导航|激光与光电子学进展
期刊信息/Journal information
激光与光电子学进展
激光与光电子学进展

范滇元

月刊

1006-4125

lop@siom.ac.cn

021-69918222

201800

上海市嘉定区清河路390号(上海市800-211信箱)

激光与光电子学进展/Journal Laser & Optoelectronics ProgressCSCD北大核心CSTPCD
查看更多>>本刊由中科院上海光学精密机械研究所和国家惯性约束聚变委员会联合主办。旨在关注科技发展热点,报道高新技术前沿,追踪科技研发动态,介绍科学探索历程;展示最新科技产品,汇萃时尚科技讯息。
正式出版
收录年代

    基于改进YOLOv5s的轻量化交通标志识别检测算法

    刘菲钟延芬邱佳伟
    92-104页
    查看更多>>摘要:为应对常见交通标志检测方法在光照条件不佳、捕获远距离小目标、复杂背景等情况下检测精度及模型计算效率不足的问题,提出一种改进的YOLOv5s算法,命名为BMGE-YOLOv5s.所提方法将YOLOv5s的原始骨干网络替换为BoTNet(bottleneck Transformer network),设计轻量化网络C3GBneckv2,引入GhostNetv2 bottleneck和高效的通道注意力机制,显著增强模型对交通标志的特征提取能力并降低参数量.为进一步提高对边界框的定位精度,采用MPDIoU损失函数进行优化.实验结果表明,改进后的网络模型在交并比阈值为0.5时的平均精度均值为93.1%,在同一数据集下相较基准模型提升3.3百分点,浮点运算数比基准模型减少9.375%,参数量减少~26.03%,检测速度提升~67.40%.所提算法有效平衡了鲁棒性和实时性,相比传统方法具有明显的性能优势.

    YOLOv5s交通标志识别与检测深度学习注意力机制轻量化MPDIoU损失函数

    基于数字剪切散斑干涉与红外热成像的复合缺陷检测

    闫旭帅李伟仙吴思进
    105-110页
    查看更多>>摘要:无损检测技术由于依据原理的差异,都有各自的局限性,而多种检测技术的复合使用可以从多个原理方面进行检测,获得更好的检测效果.本文提出了一种基于数字剪切散斑干涉技术和红外热成像技术的复合缺陷检测方法,采用统一的激励源对光路进行融合设计,两种技术同步进行数据采集,并综合结果进行缺陷分析.实验表明,该检测方法结合了两种方法的检测特点,在实际检测时获得了较好的缺陷检测效果.

    无损检测数字剪切散斑干涉技术红外热成像技术复合检测

    基于BP神经网络的光子计数激光雷达点云滤波

    于士澳孔伟马汝佳黄庚华...
    111-118页
    查看更多>>摘要:随着高灵敏探测技术的不断发展,单光子量级的测量灵敏度成为了可能,结合高精度的计时技术,基于时间相关单光子计数的激光雷达应运而生,其能够大幅提高测量的分辨率和精度.然而,单光子量级的高灵敏探测极易受环境噪声的影响,光子计数激光雷达在测量的过程中会产生大量的噪声数据.为了克服噪声的影响,提出一种基于BP神经网络的光子计数激光雷达点云数据去噪算法.通过选取点云数据特征值,进行归一化处理,以训练BP神经网络,最终达到精确的二分类去噪效果.所提算法能够减小传统去噪算法中引入的人为误差,在多种探测环境下具备出色去噪性和强大适应性.在强背景噪声探测条件下,该算法的F数仍能达到0.9773.在模拟各种背景噪声的条件下,所提算法具有良好的信息提取能力,并通过对ICESAT-2点云实验数据进行的验证,进一步证明该算法的一致性优势.

    光子计数激光雷达神经网络光子点云滤波方法

    基于改进RandLA-Net的道路标线点云提取方法

    范佳李治霖王勇
    119-130页
    查看更多>>摘要:针对高精度地图中道路标线提取精度差的问题,提出一种基于改进RandLA-Net的道路标线点云提取方法.道路标线具有平缓、起伏程度小、与水平面近似平行、回波强度大等空间特征,因此利用全方差、平整度、垂直度与回波强度可以将道路标线与其他地物区分开来,从而提高RandLA-Net邻域点云的差异性与相似性.首先分别计算点云的3种协方差特征,然后利用经特征融合模块改进后的RandLA-Net对其进行特征融合与语义分割,最后将分割结果通过欧氏聚类精细化处理,得到最终的道路标线点云.采用Toronto-3D与WHU-MLS公开数据集对所提方法进行验证,分别在语义分割阶段和道路标线提取阶段同常用的点云语义分割方法与传统阈值法进行对比,实验结果表明,所提方法能够提取更加完整、精确的道路标线点云.

    激光雷达道路标线深度学习语义分割

    基于改进ACV模型的视差估计方法

    秦伦明余斌崔昊杨边后琴...
    131-140页
    查看更多>>摘要:双目立体匹配作为计算机视觉领域的一个热点问题,在距离感知、遥感、自动驾驶等诸多场景中有着广泛的应用.针对目前方法在深度不连续以及边界区域存在视差预测不准确的问题,提出一种基于改进注意力拼接代价体网络的端到端视差估计方法.首先引入多尺度特征融合网络,将浅层与深层包含丰富信息的多尺度特征图融合,增强图像细节的细粒度表示,缓解图像中深度不连续区域视差预测不准确的问题.接着设计Sobel边缘平滑损失,建立视差图边界与场景边缘轮廓对应的约束关系,缓解图像中目标边界区域视差预测不准确的问题.在Sceneflow数据集上的实验结果表明,所提方法在EPE和D1指标上分别达到0.467和1.51%,在KITTI数据集上,所提方法在3-All和D1-All指标上分别达到 1.44%和 1.61%.与注意力拼接代价体网络相比,所提方法在EPE和D1指标上分别降低 3.51%和 5.63%,在3-All与D1-All指标上分别降低2.04%和2.42%,可获得更好的视差估计效果.

    双目立体匹配注意力拼接代价体网络端到端视差估计多尺度特征融合网络Sobel边缘平滑损失

    基于体素自注意力辅助网络的三维目标检测

    曹捷彭忆强樊利康王龙飞...
    141-150页
    查看更多>>摘要:针对目前依赖于卷积神经网络(CNN)的激光雷达目标检测算法对自动驾驶场景的空间结构理解不深刻导致检测效果差的问题,提出了一种能够增强特征提取能力、可直接应用于大部分基于体素的检测算法的体素自注意力辅助(VSAA)网络.首先,VSAA网络在体素特征编码的基础上进一步构造体素哈希表对体素进行二次编码,在后续自注意力计算过程中有效提高了搜索相关体素的效率;然后,VSAA网络将自注意力机制应用到体素层面,从而获取到丰富的全局信息和深层次的上下文语义信息;最后,将VSAA网络应用在基准算法SECOND和PV-RCNN上,进而提出了VA-SECOND和VA-PVRCNN算法,并通过融合VSAA网络与CNN特征弥补了CNN感受野小的缺点,增强了检测算法对整个空间场景的理解能力.在KITTI数据集上的实验结果表明:相比于基准算法,VA-SECOND和VA-PVRCNN算法对所有检测目标的平均检测精度分别提高了1.16百分点和1.54百分点,证明了VSAA网络的有效性.

    激光雷达目标检测自动驾驶体素自注意力

    基于特征关联的双视场目标交接方法

    伊丽娜王向军王霖徐宗伟...
    151-159页
    查看更多>>摘要:针对双摄像头视觉系统在目标交接时面临的尺度变化挑战,提出了一种基于特征关联的双视场目标交接方法.首先通过单应矩阵在视场切换后对目标进行初步定位,随后利用优化的YOLOv5目标检测网络搜索候选目标,最终使用改进的OSNet网络进行特征关联.为提升目标交接的准确性,优化了YOLOv5的损失函数,并在OSNet中引入瓶颈注意力模块及余弦距离度量函数.在CrowdHuman数据集和Market-1501数据集上的实验结果表明,优化后的YOLOv5网络的平均精度提升了1.0百分点,达到38.5%.改进后的OSNet网络的平均精度均值提高了5.4百分点,达到68.1%.将本文方法部署在瑞芯微RK3399Pro嵌入式平台,搭载分辨率均为1600×1200、焦距分别为35 mm和8 mm的60 frame/s摄像头进行外场实验,实验结果表明,本文方法能够在14 frame内完成目标的精准交接,验证了其在实际监控场景中的可行性与稳定性.

    特征关联目标交接深度学习注意力机制相似度度量

    一种基于模糊图像评价与特征匹配改进的视觉SLAM方法

    刘毓焦宇航任超锋
    160-170页
    查看更多>>摘要:针对运动模糊会降低视觉同步定位与制图(SLAM)运行精度的问题,提出了一种基于模糊图像评价与特征匹配改进的视觉SLAM方法.首先,通过分析图像运动模糊的产生原理,基于再模糊理论设计了一种模糊参数,用于表示图像的模糊程度;然后,使用自适应阈值对模糊图像进行删除;最后,在特征匹配环节改进了基于网格的运动统计算法,代替了SLAM常用的特征匹配方法.通过对不同环境的两种开源数据集进行实验与分析,结果表明:1)所设计的模糊参数能够有效表征图像的模糊程度,该方法在标准图像库中的预测图像质量评价分数,与其他算法相比,均方根误差减小了9.3%~12.3%;在KITTI数据集上使用自适应阈值进行模糊图像分类,与其他算法相比,准确率提升了 11.0%~17.2%、F1分数提升了22.9%~30.9%.2)改进的特征匹配算法提升了特征匹配的质量,在KITTI数据集上,与常规特征匹配算法相比,内点率提升了 11.6%~33.1%、匹配精度提升了 30.4%~38.9%、匹配耗时减少了 52.8%~55.8%.3)整体方法能减轻运动模糊对视觉SLAM定位的负面影响,与常规视觉SLAM方法相比,该方法在处理长距离复杂线路的图像序列时,平均绝对误差下降了10.4%~26.0%,均方根误差下降了10.0%~27.3%.

    同步定位与制图运动模糊图像质量评价基于网格的运动统计算法

    基于拓扑感知和通道注意力的点云分类与分割

    刘鑫陈春梅邓豪刘桂华...
    171-180页
    查看更多>>摘要:针对基于深度学习点云处理方法因浅层几何信息提取不充分、高层级语义特征损失导致分类分割效果不佳的问题,提出一种基于拓扑感知和通道注意力的点云分类分割网络,从信息扩增及特征增强两方面提升点云分类分割的准确性.首先,针对点云数据无序性导致的浅层信息特征表达弱的问题,利用局部最小三角策略构建了点云数据与邻域点的拓扑关系;然后,构建了残差多层感知器模块以提取更为精细的的局部几何特征;最后,采用混合池化对局部信息进行特征聚合,并结合通道亲和注意力机制减少网络中的特征损失.分别在ModelNet40、ScanObjectNN、ShapeNet Part以及S3DIS数据集上进行了大量对比实验,分类任务上总体分类精度分别达到了93.6%、85.6%,分割任务上平均交并比分别达到了85.8%、63.7%,实验结果证明了所提方法在点云分类分割方面性能优异.

    机器视觉拓扑感知注意力机制点云分类与分割

    复杂泊车场景下障碍物三维重建方法研究

    马世典黄宇轩江浩斌李傲雪...
    181-192页
    查看更多>>摘要:针对复杂智能泊车场景下对不规则障碍物的智能检测任务,提出一种采用网格化结构光投影检测区域,获取结构光网格在障碍物表面产生的形变,提高障碍物特征采集精度,并训练端到端网络生成深度图像的方法.进而融合RGB(Red green blue)图像的外形轮廓特征和深度图像的三维深度特征,提出RGB和深度图像的双特征并行处理算法,设计多尺度特征融合模型,在不增加模型复杂度的基础上实现多特征提取和深度融合,以更好地指导Mesh模型向真实三维模型转变.最终,以多尺度特征为输入建立基于图卷积神经网络的端到端三维重建模型.智能泊车场景实验结果表明,与基础三维重建模型相比,所提出的模型在查准距离误差和移动距离误差均值上分别降低了2%和9%;与三种主流三维重建模型相比,查准距离误差均值分别降低了60%、2%和78%,移动距离误差分别降低了16%、23%和91%.

    深度学习智能泊车三维重建多尺度特征融合