基于双输入卷积神经网络的环境声事件识别

ENVIRONMENTAL SOUND EVENT RECOGNITION BASED ON DOUBLE-INPUT CONVOLUTIONAL NEURAL NETWORK

扫码查看

原文链接

国家科技期刊平台
NETL
NSTL
维普
万方数据

中文摘要：针对前融合的特征融合方式不利于卷积神经网络提取高阶特征的问题,提出一种基于双输入卷积神经网络的特征融合框架.该特征融合框架将两种声学特征分别经过不同的卷积和池化策略进行高阶特征提取,将高阶特征进行拼接并送入输出层输出分类结果.这种方式不仅为不同的特征匹配不同的卷积和池化策略,还避免了单位或尺度不同的特征拼接在一起干扰卷积核的特征提取.经公开数据集的评估结果显示,该多特征融合框架相比单一特征和现有的融合方式性能更优.此外,将此框架应用于实际场景下的汽车鸣笛声的识别,结果显示,查全率达到87.7％,查准率达到84.7％,F1度量达到86.2％,优于其他方法,验证了该方法在实际应用中的可行性.

作者：

李芳足、罗丽燕、王玫

展开 >

作者单位：

桂林电子科技大学认知无线电与信息处理教育部重点实验室广西桂林541004

桂林理工大学信息科学与工程学院广西桂林541007

关键词：

环境声事件识别特征融合卷积神经网络

基金：

国家自然科学基金广西重点研发计划广西自然科学基金中国博士后科学基金广西壮族自治区研究生科研创新项目桂林电子科技大学创新项目

项目编号：

617711512017AB080722016GXNSFBA380142016M602921XBYCSW20191392019YCXS038

出版年：

2022

DOI：

10.3969/j.issn.1000-386x.2022.07.025

计算机应用与软件

上海市计算技术研究所上海计算机软件技术开发中心

计算机应用与软件

CSTPCD北大核心

影响因子：0.615

ISSN：1000-386X

年,卷(期)：2022.39(7)

参考文献量1