首页期刊导航|电声技术
期刊信息/Journal information
电声技术
电声技术

史丽丽

月刊

1002-8684

tvea@263.net.cn

010-59570226

100015

北京市朝阳区酒仙桥北路乙7号

电声技术/Journal Audio Engineering北大核心CSTPCD
查看更多>>本刊系信息产业部主管的我国电声专业中文核心期刊及引文源刊物。设有声频工程、扬声器与传声器、器件与电路、语音技术、电声基础、网络与多媒体、通信电声、标准与检测、节目制作与广播、噪声控制、知识之窗、产品撷拾、动态信息等栏目。以应用技术为主、兼顾学术与科普,以技术交流为主、兼顾市场信息与产品商情,在电声专业领域起技术向导和产品推广作用。
正式出版
收录年代

    基于深度学习的语音识别系统实现方法

    窦亚珍
    74-76页
    查看更多>>摘要:研究基于深度学习的语音识别系统实现方法,首先探讨语音识别系统的总体框架,其次深入研究梅尔倒谱系数(Mel-Frequency Cepstral Coefficient,MFCC)的提取和深度卷积神经网络(Deep Convolutional Neural Network,DCNN)的基本原理,最后基于Python和PyTorch框架进行系统测试.实验结果表明,所提方法在准确率、精确率及召回率方面均表现优异,能够较好地捕捉大多数样本.

    深度卷积神经网络(DCNN)语音识别Python

    基于一维卷积神经网络的语音识别系统构建方法

    刘洋廉咪咪
    77-79页
    查看更多>>摘要:提出一种基于一维卷积神经网络(1D Convolutional Neural Network,1D-CNN)的语音识别系统.首先研究基于1D-CNN的语音识别系统框架,其次重点介绍使用TensorFlow构建该系统的方法,最后采用LibriSpeech数据集,在无噪声、轻微噪声和严重噪声条件下进行系统测试,并使用准确率、召回率、F1 等指标进行评估.实验结果表明,所提出的系统在无噪声和轻微噪声条件下具有较高的识别准确率和稳定性,即使在严重噪声环境中也表现出较好的健壮性.

    一维卷积神经网络(1D-CNN)语音识别系统构建TensorFlow框架

    基于神经网络的光纤传感系统声纹识别方法

    马鼎山
    80-82页
    查看更多>>摘要:针对传统声纹识别系统存在的易受环境噪声干扰、电磁兼容性差等问题,提出一种基于神经网络的光纤传感系统声纹识别方法.该方法利用光纤传感器采集声学信号,结合深度学习算法实现声纹特征提取和匹配.通过光纤声学信号预处理、深度学习特征提取、自适应声纹匹配等关键技术,有效提高了识别的准确性和健壮性.

    声纹识别光纤传感深度学习

    基于MFCC和HMM的语音识别优化方法研究

    郭佳淇张继通
    83-85页
    查看更多>>摘要:为探究基于梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔可夫模型(Hidden Markov Model,HMM)的语音识别优化方法,首先探讨语音识别系统的基本框架设计,其次分析MFCC特征提取方法,再次引入期望最大化(Expectation Maximization,EM)算法优化HMM参数,最后利用THCHS-30 数据集进行实验验证.结果表明,引入EM算法优化HMM,可有效克服传统HMM在复杂语音环境下的识别困难问题,显著提升系统的识别精度和健壮性.

    语音识别梅尔频率倒谱系数(MFCC)隐马尔可夫模型(HMM)期望最大化(EM)

    基于神经网络的高保真音频重建方法研究

    罗明挽
    86-88页
    查看更多>>摘要:为提升受损音频信号的质量,提出一种基于神经网络的高保真音频重建方法.该方法利用卷积神经网络(Convolutional Neural Network,CNN)提取特征,利用自适应滤波器抑制噪声,利用生成对抗网络进行音频重建.实验结果表明,在不同噪声环境下,该方法能显著提高音频质量,尤其在低信噪比(Signal-to-Noise Ratio,SNR)条件下表现优异.

    高保真音频重建卷积神经网络(CNN)

    基于智能语音交互的智慧教学学情识别方法

    叶韵陈家立
    89-91页
    查看更多>>摘要:近年来,智能语音交互技术已广泛应用于智慧教学.提出一种基于智能语音交互的智慧教学学情识别方法,通过多模态语音识别、语音情感分析、语音交互行为分析全面评估学生的学习状态.实验结果表明,该方法在提升学生学习成绩和学习体验方面具有积极作用,对个性化教学具有重要意义.

    智能语音交互学情识别多模态语音识别

    基于语音识别技术的电子商务平台交互系统设计

    张慧
    92-94页
    查看更多>>摘要:语音识别技术作为人工智能的重要分支,已广泛应用于各种智能系统,尤其是电子商务平台.设计基于语音识别技术的电子商务平台交互系统,详细探讨系统架构设计、技术选型与集成、交互设计以及用户界面设计,提升平台的操作简便性和交互智能化,进一步推动电商服务的智能化发展.

    语音识别技术电子商务平台交互系统设计

    基于用户语音情感分析的景区反馈评估方法

    胡辉
    95-97页
    查看更多>>摘要:提出一种基于用户语音情感分析的景区反馈评估方法.首先,构建一个面向景区评估的情感分析框架,采用梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)提取语音特征.其次,利用长短期记忆(Long Short-Term Memory,LSTM)网络对提取的特征进行情感极性分类,将情感分为积极、消极、中性.最后,在交互式情感二元动作捕捉(Interactive Emotional Dyadic Motion Capture,IEMOCAP)数据集上进行实验.实验结果显示,本方法在精确率、召回率、准确率等指标上均表现出色,特别是在中性情感分类中达到了较高的识别性能.

    语音情感分析景区评估梅尔频率倒谱系数(MFCC)长短期记忆(LSTM)网络

    语音智能控制技术在广播电视监测系统中的应用分析

    刘海歌
    98-100页
    查看更多>>摘要:为探讨语音智能控制技术在广播电视监测系统中的具体应用,首先介绍语音智能控制技术的基本概念及其在广播电视监测中的应用背景,阐述该技术的特性,详细描述广播电视监测系统的技术架构及关键组件.其次,论述语音智能控制技术的集成步骤和具体应用场景,强调该技术在提高监测效率和处理紧急情况能力方面的优势.最后,展望语音智能控制技术在广播电视监测系统中的发展趋势.

    语音智能控制广播电视监测系统应用分析

    声音识别技术在计算机信息检测中的应用研究

    吕虎
    101-103页
    查看更多>>摘要:重点探讨声音识别技术在计算机信息检测中的应用,通过阐述声音识别的基本原理,详细介绍声音识别在计算机信息检测中的应用流程,包括声音采集与预处理、特征提取、模式匹配与识别这 3 个主要步骤.实验结果表明,基于梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)特征和支持向量机(Support Vector Machine,SVM)分类器的声音识别系统能够有效识别计算机使用过程中的正常操作声音和潜在威胁声音,为计算机安全监测提供了新的解决方案.

    声音识别计算机信息检测语音特征提取