摘要
呼吸系统疾病是全球重症和死亡的最常见原因之一.快速精确的检测对呼吸病治疗至关重要.随着人工智能技术的发展,使用深度学习方法通过咳嗽声音检测呼吸系统疾病是一种有效的解决方案.然而,由于公开数据集较少,基于咳嗽声音的呼吸病检测分类研究较少,将手工特征和最新的深度音频嵌入进行特征融合的研究也较少.本文使用音频分割和语音数据增强方法对数据集进行扩充并评估了4种不同类型的声学特征在呼吸病咳嗽检测任务中的适用性.在此基础上,设计了一个基于融合特征的双通道卷积神经网络TCCNN.实验结果表明,当使用MFCC与OpenL3特征作为TCCNN模型输入时,在呼吸病咳嗽检测任务中可以获得74.1%的F1分数和73.5%的准确率,优于仅使用单一特征的结果.