首页|基于双输入卷积神经网络的环境声事件识别

基于双输入卷积神经网络的环境声事件识别

ENVIRONMENTAL SOUND EVENT RECOGNITION BASED ON DOUBLE-INPUT CONVOLUTIONAL NEURAL NETWORK

扫码查看
针对前融合的特征融合方式不利于卷积神经网络提取高阶特征的问题,提出一种基于双输入卷积神经网络的特征融合框架.该特征融合框架将两种声学特征分别经过不同的卷积和池化策略进行高阶特征提取,将高阶特征进行拼接并送入输出层输出分类结果.这种方式不仅为不同的特征匹配不同的卷积和池化策略,还避免了单位或尺度不同的特征拼接在一起干扰卷积核的特征提取.经公开数据集的评估结果显示,该多特征融合框架相比单一特征和现有的融合方式性能更优.此外,将此框架应用于实际场景下的汽车鸣笛声的识别,结果显示,查全率达到87.7%,查准率达到84.7%,F1度量达到86.2%,优于其他方法,验证了该方法在实际应用中的可行性.

李芳足、罗丽燕、王玫

展开 >

桂林电子科技大学认知无线电与信息处理教育部重点实验室 广西 桂林541004

桂林理工大学信息科学与工程学院 广西 桂林541007

环境声事件识别 特征融合 卷积神经网络

国家自然科学基金广西重点研发计划广西自然科学基金中国博士后科学基金广西壮族自治区研究生科研创新项目桂林电子科技大学创新项目

617711512017AB080722016GXNSFBA380142016M602921XBYCSW20191392019YCXS038

2022

计算机应用与软件
上海市计算技术研究所 上海计算机软件技术开发中心

计算机应用与软件

CSTPCD北大核心
影响因子:0.615
ISSN:1000-386X
年,卷(期):2022.39(7)
  • 1