基于卷积神经网络的多模型交通场景识别研究

扫码查看

原文链接

万方数据
维普

中文摘要：利用人工智能中的视觉分析技术,实现对高分辨率交通视频中出现的各个目标类别进行实时目标检测、语义分割和目标追踪.数据集结合BDD100K和Mapillary Vistas.训练中不仅对模型中的参数进行调整,还对多个模型进行改进与创新.目标检测模型使用EfficientNet-B1作为主干网络,使用ASPP与改进后的FPN作为脖颈网络,通过引入多种模型训练技巧,对模型进行优化,最终结果减少约2.3倍的参数量,在不同数据集上的准确率都有所提升.目标追踪使用DeepSort追踪算法对多个目标类别进行追踪计数.语义分割使用Encoder-Decoder结构,使用EfficientNet-B4作为主干网络,参照U-Net++网络使用卷积层作为特征提取模块,反卷积层作为上采样模块,通过联结不同大小的特征图,得到最终输出结果.将改进语义分割模型与MobileNetV2和DeeplabV3网络结合的模型进行对比,减少约1.35倍的参数量.实验证明,通过深度学习算法提取鲁棒性特征能够为自动驾驶和辅助驾驶场景中的检测识别提供便利.

外文标题：Research on Multi-model Traffic Scene Recognition Based on Convolution Neural Network

作者：

姚芷馨、张太红、赵昀杰

展开 >

作者单位：

新疆农业大学,新疆乌鲁木齐 830052

关键词：

目标检测语义分割特征提取上采样鲁棒性特征

基金：

自治区科技重大专项自治区创新项目校级创新项目

项目编号：

2017A01002XJAUGRI2019035XJAUGRI2021048

出版年：

2022

DOI：

10.3969/j.issn.1673-629X.2022.07.016

计算机技术与发展

陕西省计算机学会

计算机技术与发展

CSTPCD

影响因子：0.621

ISSN：1673-629X

年,卷(期)：2022.32(7)

参考文献量3