基于U-Conformer的多特征融合鸟鸣声分离方法

扫码查看

原文链接

国家科技期刊平台
NETL
NSTL
万方数据

中文摘要：针对多个鸟类个体同时发声导致的鸣声混叠问题,本文提出了一种融合录音通道间空间特征的鸟类鸣声分离方法.该方法将混叠鸣声信号的声谱特征和空间特征作为分离模型的输入,提出深度学习模型U-Conformer来预测每个鸣声源方向的幅值谱掩膜(spectral magnitude mask,SMM),通过模型估计的SMM从混叠鸣声信号中恢复每个鸣声源信号.由多源混叠鸟类鸣声数据的实验结果表明,本文提出的分离方法较其他深度学习模型结构具有更好的分离效果,有助于更好地分析野外鸟类鸣声录音.

外文标题：U-Conformer-based multi-feature fusion bird sound separation

外文关键词：

Bird sound separationspatial featuresConformerspectral magnitude mask

作者：

倪东明、石煜炜、夏灿玮、谢将剑

展开 >

作者单位：

北京林业大学工学院,100083,北京

生物多样性与生态工程教育部重点实验室,北京师范大学生命科学学院,100875,北京

北京林业大学生物多样性智慧监测研究中心,100083,北京

关键词：

鸟鸣声分离空间特征 Conformer 幅值谱掩膜

基金：

中国高校产学研创新基金资助项目中央高校基本科研业务费资助项目北京市自然科学基金资助项目

项目编号：

2021LDA050022021ZY706214040

出版年：

2023

DOI：

10.12202/j.0476-0301.2023007

北京师范大学学报(自然科学版)

北京师范大学

北京师范大学学报(自然科学版)

CSTPCDCSCD北大核心

影响因子：0.505

ISSN：0476-0301

年,卷(期)：2023.56(3)

参考文献量1