首页期刊导航|电声技术
期刊信息/Journal information
电声技术
电声技术

史丽丽

月刊

1002-8684

tvea@263.net.cn

010-59570226

100015

北京市朝阳区酒仙桥北路乙7号

电声技术/Journal Audio Engineering北大核心CSTPCD
查看更多>>本刊系信息产业部主管的我国电声专业中文核心期刊及引文源刊物。设有声频工程、扬声器与传声器、器件与电路、语音技术、电声基础、网络与多媒体、通信电声、标准与检测、节目制作与广播、噪声控制、知识之窗、产品撷拾、动态信息等栏目。以应用技术为主、兼顾学术与科普,以技术交流为主、兼顾市场信息与产品商情,在电声专业领域起技术向导和产品推广作用。
正式出版
收录年代

    复杂环境下基于深度学习的声音识别研究

    付兆婷
    40-42页
    查看更多>>摘要:针对复杂环境下的声音识别问题,提出一种基于深度学习的声音识别方法.首先,通过自适应滤波降噪和梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficient,MFCC)提取等方法提取声音特征.其次,采用L2正则化的卷积神经网络(Convolutional Neural Network,CNN)识别声音,以提高模型的泛化能力和准确性.最后,使用ESC-50数据集对所提方法进行验证和测试.实验结果表明,该方法的精确率、准确率及召回率均优于对比方法.

    复杂环境卷积神经网络(CNN)声音识别

    基于轻量型卷积神经网络的语音情感识别方法研究

    黄荣雷
    43-45页
    查看更多>>摘要:为提高语音情感识别方法的准确率,研究基于轻量型卷积神经网络的语音情感识别方法.首先分析语音情感识别的理论框架,其次分析时间卷积网络(Temporal Convolutional Network,TCN)的基本结构及具体原理,最后采用数据集进行实验.实验结果表明,基于TCN的语音情感识别方法在不同实验中具有较好的性能和有效性.

    时间卷积网络(TCN)情感识别轻量型模型识别框架

    基于卷积神经网络的实时语音分割优化研究

    杨波
    46-48页
    查看更多>>摘要:为进一步提高实时语音分割的性能,分析基于卷积神经网络(Convolutional Neural Networks,CNN)的实时语音分割优化方法.首先,介绍CNN的基本结构和在语音分割中的数学原理.其次,引入修剪技术,根据权重的重要性分数决定保留或删除权重.实验结果表明,该方法的准确率、召回率、F1值及用时均优于传统CNN.

    卷积神经网络(CNN)语音分割实时性修剪技术

    语种识别技术在中短波广播强噪声语音音频识别中的应用

    刘琪莫东林
    49-51页
    查看更多>>摘要:在中短波广播中,语音信号经常受到各种噪声的影响,如电磁干扰和环境噪声,增加了语音识别的难度.基于此,全面探讨语种识别技术在中短波广播强噪声环境中的应用,详细介绍特征提取技术、模型适应策略、语言特征库的构建与模型调整方法,旨在提高中短波广播中语种识别的准确率和效率.

    语种识别技术中短波广播强噪声语音音频识别

    基于深度学习的语音处理实时性优化

    赵颖颖贾凤勤
    52-54页
    查看更多>>摘要:针对基于深度学习的语音处理系统在实时性方面面临的挑战,提出一种连接剪枝的优化方法,旨在提高语音识别的实时性.通过深入研究基于深度学习的语音识别系统的基本原理,引入连接剪枝的方法对循环神经网络(Recurrent Neural Network,RNN)进行实时性方面的优化.采用LibriSpeech数据集对优化方法和传统方法进行对比实验,结果表明优化方法能够有效提高模型的识别准确性和运行效率.

    深度学习语音识别循环神经网络(RNN)连接剪枝

    基于语音识别技术的通信网络身份验证系统设计

    刘鑫
    55-57页
    查看更多>>摘要:在网络环境中,确保用户身份的真实性至关重要.语音识别技术提供了一种基于生物特征的安全解决方案,它通过分析用户的语音样本来验证身份,具有非接触性和难以仿造的特点.详细探讨语音识别技术在通信网络身份验证系统中的应用,提出一套基于语音识别的身份验证系统设计方案,并通过案例验证其有效性与实用性.

    语音识别通信网络身份验证系统

    基于循环神经网络模型的无人机音频信号识别算法研究

    吴晶晶罗志豪李伟赵慎...
    58-63页
    查看更多>>摘要:近年来,无人机的广泛应用引发诸多隐私和安全问题.针对此问题,研究基于循环神经网络(Recurrent Neural Network,RNN)模型的无人机音频信号识别算法.首先,对于无人机的音频信号进行特征值提取,基于设计的RNN模型,设置3层长短期记忆网络(Long Short-Term Memory,LSTM)和3层Dropout.其次,在输出层使用Softmax作为激活函数输出结果,并在实验过程中不断更新神经元和Dropout的参数.最后,基于实际采集的音频数据进行无人机检测.实验结果表明,所提出算法的准确率达到96.33%,能够满足无人机检测的实际需求.

    无人机音频识别特征提取循环神经网络(RNN)

    基于FFT和Masking的实时语音通话降噪算法

    徐琳娜
    64-66页
    查看更多>>摘要:针对语音通话质量的提升问题,提出一种基于快速傅里叶变换(Fast Fourier Transform,FFT)和Masking技术的实时语音通话降噪算法.首先,提出一个实时语音通话降噪的基本框架,并研究了帧分割、窗函数处理及FFT的数学原理.其次,阐述了基于人耳听觉特性的Masking方法及其在频域中的应用.最后,通过逆快速傅里叶变换(Inverse Fast Fourier Transform,IFFT)将信号转换回时域,并进行实验分析.实验结果表明,该降噪算法可以有效改善语音的清晰度和整体感知质量.

    语音降噪快速傅里叶变换(FFT)Masking技术频域处理

    基于小波变换的语音信号去噪算法优化

    王红娟尚莹莹
    67-69页
    查看更多>>摘要:深入研究基于小波变换的语音信号去噪方法,并针对传统方法在复杂噪声环境下处理效果不佳的问题,提出一种基于自适应阈值的小波变换去噪优化方法.首先,分析小波变换去噪的基本原理.其次,深入研究自适应阈值技术的数学模型,并将其应用于小波变换,通过动态调整阈值来适应不同噪声环境的需求.最后,采用Aurora数据集进行实验验证.实验结果表明,该方法能够有效去除噪声.

    小波变换语音去噪自适应阈值语音信号

    一种听觉无感的音频模拟水印加注方法

    陈骁汤跃忠王荔田野...
    70-72,76页
    查看更多>>摘要:数字音频水印在音频转码或经音频在空气中播放转录后不能保留,具有很大的局限性.基于此,提出一种音频的模拟水印加注方法,并分析了详细的设计流程.该方法在设计时针对人耳听觉特性进行了优化,不会影响音频的整体听感,适用于转码、压缩及空气传播等典型音频传播场景.

    音频水印模拟水印加注方法