首页期刊导航|激光与光电子学进展
期刊信息/Journal information
激光与光电子学进展
激光与光电子学进展

范滇元

月刊

1006-4125

lop@siom.ac.cn

021-69918222

201800

上海市嘉定区清河路390号(上海市800-211信箱)

激光与光电子学进展/Journal Laser & Optoelectronics ProgressCSCD北大核心CSTPCD
查看更多>>本刊由中科院上海光学精密机械研究所和国家惯性约束聚变委员会联合主办。旨在关注科技发展热点,报道高新技术前沿,追踪科技研发动态,介绍科学探索历程;展示最新科技产品,汇萃时尚科技讯息。
正式出版
收录年代

    用于遥感图像变化检测的结构感知多尺度混合网络

    刘祺曹林田澍杜康宁...
    313-323页
    查看更多>>摘要:近年来,卷积神经网络(CNN)凭借强大的特征表示能力在遥感图像变化检测领域取得了显著成就.然而,CNN在双时态图像远程依赖建模方面存在不足,导致对结构信息的识别性较差.与之不同,Transformer技术能够有效捕捉输入像素间的长距离依赖关系,有助于感知和推理图像中的结构信息.为解决现有变化检测方法在模型中难以兼顾全局和局部特征信息的问题,提出多尺度级联CNN-Transformer混合网络.该算法能够充分利用混合网络中的全局和局部语义信息,提升模型对变化对象结构-语义信息的感知能力,级联架构增强了不同尺度间的交互能力,使模型更易理解不同粒度特征的区别与联系.此外,本文还对不同尺度特征进行了权重调节,提升模型对多尺度信息的利用能力.所提方法在CDD和GZ-CD数据集上的F1分数分别达97.8%和87.1%.在两个标准数据集上的实验结果表明,所提方法能有效利用不同尺度特征信息,提升变化检测精度.

    变化检测深度学习遥感结构感知混合网络

    基于双分支轻量化网络的微表情识别算法

    张波武瑀繁
    324-333页
    查看更多>>摘要:针对采用卷积神经网络识别微表情时提高精度后往往会伴随复杂性增加的问题,提出一种改进的双流轻量级注意力网络(EDSMISEViTNet)用于微表情识别.首先对微表情样本进行预处理,提取峰值帧作为空间特征,采用TV-L1光流法提取起始帧和峰值帧之间的时间特征;然后基于MobileViT网络改进并设计了Inception和SE模块相结合的MI模块,并加入注意力模块以高效提取有效特征;将时间特征和空间特征分别输入该网络,对结果特征进行拼接融合继而分类.为使结果更加准确,将CASME II、SAMM以及SMIC数据集组合为复合数据集进行实验.实验结果表明,所提模型的训练参数量仅为3.9×106,处理单个样本的时间为71.8 ms.与现有方法相比,所提方法在保证低参数量的同时,准确率也具有良好表现.

    微表情识别双流卷积神经网络TV-L1光流法视觉Transformer注意力机制MobileViT网络

    基于相关性感知和特征重学习的无监督域自适应行人重识别

    李亚军张敏邓洋洋辛明...
    334-342页
    查看更多>>摘要:不同数据集之间的领域多样性对在一个数据集上训练的行人重识别(Re-ID)模型适应另一个数据集提出了明显的挑战.目前最先进的无监督领域自适应方法是通过对目标领域的聚类算法生成的伪标签进行优化的,但聚类过程中不可避免的标签噪声却被忽略了.这种有噪声的伪标签实质上降低了模型在目标域上进一步改进特征表示的能力.为了解决这一问题,提出一种基于相关性感知注意力(RAA)机制和局部特征重学习(FRL)的相互教学方法进行无监督域自适应行人重识别.在特征提取上,使用多通道关注对应的行人局部特征,利用空间-通道对应关系进行全局和局部特征的判别性细节信息重学习,增强网络的特征表达能力.同时采用相关性感知注意力机制来使两个网络聚焦于不同的特征区域,增强两个网络的差异性和互补性.在公共数据集上对所提方法进行了广泛的实验验证.实验结果表明,所提方法在多个行人重识别任务中都取得了良好的成绩.

    机器视觉无监督行人重识别相关性感知

    基于层级权值交互和拉普拉斯先验的非均匀去雾

    汤永华孟妍君林森石非凡...
    343-354页
    查看更多>>摘要:针对非均匀雾霾图像去雾过程中细节丢失和雾霾残留,导致图像质量受损的问题,提出一种基于层级权值交互和拉普拉斯先验的非均匀去雾方法.首先,在基准网络中引入层级权值交互模块,以自适应地调整权值,在不同尺度上对特征图进行加权融合.同时,使用全感受野聚合模块丰富感受野,让模型更全面地理解图像内容信息.然后,引入频域信息分支,使用小波函数将图像分解为低频和高频分量,低频部分包含整体结构信息,高频部分提供局部细节信息,两者共同提高了图像的清晰度.最后,引入拉普拉斯损失重建图像,恢复图像的细节特征,提高生成图像的质量.实验结果表明,相比原始算法,所提算法在4个数据集上的峰值信噪比(PSNR)分别提高了0.8 dB、1.54 dB、1.14 dB和0.23 dB,并在测试集上取得了较优的去雾效果.

    图像处理非均匀雾霾图像层级权值交互频域信息拉普拉斯先验

    基于YOLOv7的轻量级低照度目标检测算法

    李昶昱葛磊
    355-362页
    查看更多>>摘要:低照度目标检测是目标检测任务中常见的挑战之一.通用的目标检测方法在低照度条件下性能会明显下降,而现有的低照度目标检测方法会造成大量的计算资源消耗,并不适合部署在计算能力受限的设备上.为应对上述问题,提出一种端到端的轻量级目标检测算法LL-YOLO.针对低照度图像中特征信息不明显、难以学习与辨识的问题,设计低照度图像生成算法,通过生成低照度图像来训练检测器,帮助其学习低照度环境下的特征信息;并对检测器网络结构进行调整,减少特征信息在计算过程中的损失,提高模型对特征信息的敏感度.针对低照度图像中特征信息受噪声影响严重的问题,提出聚合周边信息的A-ELAN模块,使用深度可分离卷积与注意力机制捕获周边信息,增强获得的特征信息,减弱噪声的影响.实验结果表明,LL-YOLO算法在低照度目标检测数据集ExDark上平均精度均值(mAP@0.5)达到81.1%,相较直接训练的YOLOv7-tiny算法提高11.9百分点,相比于其他算法具有较强竞争力.

    机器视觉低照度目标检测轻量级算法YOLOv7

    基于多尺度卷积神经网络的多源数据融合岩性分类方法

    戴嵩孙喜明张精明朱永山...
    363-372页
    查看更多>>摘要:在岩性分类任务中,利用单一数据源获取的特征信息有限,因此多源数据融合成为提高岩性分类准确性的重要手段.航空遥感影像和数字高程模型作为典型的遥感数据源,可以提供互补的光谱和高程信息.为了提升岩性分类的精度,提出一种融合通道空间注意力机制与多尺度卷积神经网络的多源遥感数据岩性分类方法.该方法通过设计多尺度空洞卷积模块,增强卷积神经网络对航空遥感影像和数字高程模型深层特征的学习能力,从而更好地捕捉特征的空间关系,并有效消除异构数据在原始数据空间上的结构差异.此外,通过设计局部和全局的多尺度通道空间注意力模块,以自适应方式为多源数据的光谱通道和空间区域赋予不同的权重,从而利用特征的显著性实现更有针对性的网络训练,进一步提升模型的分类性能.最后,以四川某盆地为研究区域进行有效性验证.实验结果表明,所提方法在总体分类精度、平均分类精度等评价指标上明显优于4种典型的机器学习方法,证实了所提多源数据融合方法能够充分利用不同数据源的互补优势,从而有效提高地质岩性的判别精度.

    航空遥感影像数字高程模型岩性分类特征融合卷积神经网络

    分区自适应伽马校正的非均匀光照图像增强

    马鑫喻春雨陈刚孙宁宁...
    373-380页
    查看更多>>摘要:针对非均匀光照图像在被增强处理中的过度增强问题,提出一种将光照分量和目标均值结合的自适应二维伽马函数的图像增强算法.首先,将图像转到HSV空间并提取V通道分量;对V通道分量进行并行的两种处理,一种是基于光照-反射模型,利用边缘保持性好的引导滤波器估计光照分量,另一种是将V通道分量IV的区域划分为亮区和暗区,并建立不同调整系数的目标均值函数;然后,再将光照分量和目标均值共同作为二维伽马函数的参数,对图像进行自适应伽马校正;再利用自适应直方图均衡对校正后图像进行进一步调整;最后,将调整后的V通道分量与原图像的H、S通道分量合并后转换回RGB色彩空间并输出.对DICM、LIME两个数据集中的非均匀光照图像进行增强处理的实验结果表明:相比其他4种典型增强算法,所提算法可以将原图像的信息熵(entropy)、平均梯度(MG)、信噪比(SNR)分别平均提高10.6%、97.5%、77.8%,平均运行时间为0.32 s;经所提算法增强处理后,图像中光照更自然、细节更清晰、色彩保持性更好.所提图像增强算法可以将非均匀光照图像处理为色彩真实自然、亮度均匀、细节清晰的图像,视觉效果好,并有效避免图像过度增强问题.且所提算法处理快速,有利于机器视觉等研究工作的开展.

    计算机视觉图像增强非均匀光照引导滤波伽马校正

    基于Gabor表示特征描述符的红外可见光图像配准

    徐晶包利东方明杜天娇...
    381-388页
    查看更多>>摘要:在无人机航拍场景中,不同传感器捕获的图像可能存在较大视差和分辨率差异,从而导致图像配准失败.针对这一问题,提出一种具有旋转不变Gabor表示特征描述符的红外与可见光图像配准方法.首先,求解图像加权矩阵,将Harris算法应用在相位全等中的加权矩阵方程上实现图像的关键点提取.其次,改进Gabor表示结构,使得关键点在不同方向的特征得到准确定位,从而降低由于视差较大带来的影响.最后,使用最近邻匹配(NNM)算法搭配快速抽样一致性(FSC)实现对异常值的剔除同时增加正确匹配的数量.所提方法在CVC-15立体声、LWIR-RGB长波红外和自制数据集下的平均准确率分别为46%、72%、62%,平均运行时间分别为6.886 s、7.800 s和9.631 s.实验结果验证了该方法在处理具有较大视差和分辨率差异的待配准图像时的有效性.

    红外可见光图像配准相位全等矩分析方程Gabor表示

    基于掩模和自监督学习的海浪三维重建

    黄军杰徐锋罗亮陈天宝...
    389-397页
    查看更多>>摘要:快速、准确的海浪三维重建结果对于海洋工程研究具有重要意义.针对传统海浪三维重建算法处理效率低以及生成点云中孔洞较多影响精度的问题,提出一种结合视差掩模和自监督学习的海浪三维重建算法.首先,基于图像重构、视差平滑和左右视差一致性损失训练网络模型并得到视差图;其次,添加掩模解码器用于掩模图像生成;最后,利用视差公共区域的先验知识,提出一种新的掩模损失函数,以消除图像非公共区域的视差异常值和海面遮挡问题的影响.在Acqua Alta数据集上的实验结果表明,所提算法可以有效减少海浪点云中杂点的数量,在精度接近传统算法的情况下,点云重建速度达到了0.024 s/frame.

    海浪三维重建视差掩模自监督学习掩模损失函数

    结合自适应关键帧策略与运动信息的特征匹配方法

    吴林滨曹云峰马宁
    398-408页
    查看更多>>摘要:针对视觉惯性导航系统在高动态场景下由于快速运动、成像模糊等导致特征匹配精度低的问题,提出一种结合自适应关键帧策略与运动信息的特征匹配方法.首先,基于时间、惯性运动、成像清晰度及视差4项因子构建关键帧的更新判据,提出一种自适应关键帧策略,以提升关键帧的选取质量.其次,根据惯性运动信息,通过对图像进行几何变换实现相邻关键帧图像之间的共视区域匹配,旨在增强共视区域特征的可检测性.然后,采用改进的Oriented FAST and Rotated BRIEF(ORB)特征方法进行特征点的提取与匹配,以提高视觉特征点的匹配精度.最后,在公开数据集EuRoC上对所提方法进行测试.实验结果表明,所提特征匹配方法具有较好的精度与鲁棒性,在光照变化、成像模糊等动态场景具有较好的实用价值.

    机器视觉视觉惯性导航系统动态场景特征提取与匹配传感器融合