基于改进VGG-16网络的交通声音事件分类方法研究

Research on Traffic Sound Event Classification Method Based on Improved VGG-16 Network

徐科 ¹姚凌云 ¹姚静怡 ¹姚敦辉¹

扫码查看

作者信息

1. 西南大学工程技术学院/丘陵山区农业装备重庆市重点实验室,重庆 400715
折叠

摘要

交通声音事件分类是提升城市智慧交通系统环境感知能力的关键技术之一.针对传统交通系统的环境声音感知能力弱、效率低、鲁棒性低、可分类数量少等问题,研究了一种基于VGG卷积神经网络的交通声音事件分类方法,该方法使用语谱图(spectrogram image features,SIF)作为交通声学特征,建立并优化了卷积神经网络(conv-olutional neural networks,CNN),从而实现交通声音的智能分类.首先,使用实验室采集的10种交通声音,构建了交通声音数据集.其次,利用语谱图方法对交通声音进行声学特征提取,搭建VGG-16分类算法主模型,通过双卷积层融合算法和块间直连通道对网络进行改进,得到了 VGG-TSEC网络.该优化网络的交通声音事件分类准确率可达97.18％,与优化前相比准确率提升4.68％,其权重参数降低72.76％,占用空间降低384MB.同时,将该优化模型与K邻近(KNN)、支持向量机(SVM)等机器学习方法进行对比,其准确率分别提高了 19.68％和4.41％.结果表明,VGG-TSEC交通声音分类方法可以实现警笛音、事故碰撞、行人尖叫、卡车等交通声音的高效分类,为交通声音事件分类提供参考.

关键词

交通声音事件分类/卷积神经网络/交通声音/语谱图特征/深度学习

Key words

traffic sound event classification/convolutional neural network/traffic sound/spectrogram image feature/deep learning

引用本文复制引用

基金项目

国家自然科学基金(52175121)

出版年

2023

西南大学学报(自然科学版)

西南大学学报编辑部

西南大学学报(自然科学版)

CSTPCDCSCD北大核心

影响因子：0.825

ISSN：1673-9868

参考文献量5

段落导航