期刊,声学技术 2024年卷6期_国家学术搜索

期刊信息/Journal information

声学技术

主　　编：张叔英

出版周期：双月刊

国际刊号：1000-3630

电子邮箱：sxjs@21cn.com

电　　话：021-64048159-222

邮政编码：200032

地　　址：上海市小木桥路456号

声学技术/Journal Technical AcousticsCSCD北大核心CSTPCD

查看更多>>本刊是中国科学院声学所东海研究站、同济大学声学研究所、上海市声学学会和中船重工集团726研究所合办的学术性刊物(季刊)，1982年创刊，国内外公开发行，已被《中国物理文献》数据库收录，是《中国科技引文数据库》、《中国学术期刊综合评价数据库》来源期刊，是中国科技论文统计源期刊，被《中国核心期刊(遴选)数据库》收录，在"万方数据－数字化期刊群"全文上网。并由《中国学术期刊(光盘版)》和《中国期刊网》全文收录，被评为《CAJ-CD》执行优秀期刊。2004年3月被评为中国科技核心期刊，2004年4月经专家评审，被评为中文核心期刊，并入编《中文核心期刊要目总览》(第四版)。本刊专业范围包括：超声学、生物医学超声学、电声学、水声学、海洋声学技术、建筑声学、噪声控制、生理和心理声学、声信号处理、换能器和声系统等。凡有关上述专业内容的科研论文、实验报告、综述评论、研制总结、使用经验等等，均欢迎向本刊投稿。此外，本刊还承接有关新产品的广告业务，质量保证，收费合理，欢迎刊登。

正式出版

收录年代

矩形参量阵扬声器远场指向性的研究

陈哲李梦同钟家鑫卢晶...

832-836页

查看更多>>摘要：指向性是描述参量阵扬声器产生的音频声辐射的直接指标,但由于其中复杂的非线性过程,准确且高效地预测指向性较为困难.文章采用直接球卷积模型和改进球卷积模型,理论推导了矩形参量阵扬声器的远场指向性.通过数值仿真研究了半边长均为 0.2 m的矩形活塞源参量阵扬声器,在声源频率为 64 kHz情况下音频频率对指向性的影响,并在消声室通过实验测量进行了验证.结果表明,改进球卷积模型对指向性主瓣的预测结果更好,并且能够预测出高音频声频率时的旁瓣成分,是目前指向性最有效且准确的预测方法之一.

关键词：

参量阵扬声器指向性球卷积模型

原文链接:

NETL
NSTL
万方数据

自动化近场声全息扫描测量系统的设计与实现

张宁查阳吴海军周鹤峰...

837-842页

查看更多>>摘要：针对基于多参考互谱法的近场声全息技术测试效率较低的问题,设计了一套自动化近场声全息扫描测量系统.该系统使用高精度直线导轨滑块机构,下位机使用可编程逻辑控制器控制传声器阵列快速、准确移动至预设测量位置;以NI公司的嵌入式实时控制器和数据采集卡作为数据采集设备的硬件,利用LabVIEW软件编写数据采集程序,实现多通道声压数据的实时采集.为了将传声器阵列移动和数据采集两个过程结合起来,实现测量位置声压的自动采集,文章基于QT应用程序开发框架编写上位机程序,对可编程逻辑控制器和数据采集设备进行控制,完成自动化扫描测量的整个流程.实验结果表明,该系统能够快速、准确地采集全息面上的声压数据,从而提高近场声全息的测试效率.

关键词：

近场声全息扫描测量数据采集LabVIEW软件

原文链接:

NETL
NSTL
万方数据

用于提升聋哑人语音表现力的语音合成技术

马皓天洪峰毛海全郑立通...

843-853页

查看更多>>摘要：目前,聋哑人主要通过手语的方式与健听人进行沟通,但这对未接受专业手语学习的健听人来说是一种挑战.因此,将手语转换为文本,再将文本转换成带有聋哑人音色的、健听人能理解的语音非常具有研究意义.为研究聋哑人语音合成的可行性,文章首先分析了聋哑人的语音特征,并根据分析的结论,提出了能合成高自然度、高清晰度且带有聋哑人自身声音特色的模型算法以及相应的评估体系.文章根据不同残疾程度的聋哑人语音特征,提出了面向轻度残疾聋哑人的语音转换和合成方法以及面向重度残疾聋哑人的语音克隆方法.根据分析结果,轻度残疾聋哑人语音与健听人语音具有一定的共性,因此使用AdaIN-VC语音转换模型转换出带有聋哑人音色、高可懂度的语音,并将转换好的语音结合Tacotron2语音合成模型进行文本到语音的映射.考虑到重度残疾聋哑人语音的不稳定性,文章基于Zero-shot的SV2TTS语音克隆框架,使用了ECAPA-TDNN作为重度残疾聋哑人音色表征的说话人编码器,以获取准确的聋哑人表征.此外,文章还引入基于基频情感分类的风格迁移模块,对合成语音进行风格上的迁移.实验结果表明,在保证一定相似度的情况下,实验中两位轻残聋哑人的自然度主观意见评分别从原来的2.53和 3.06提高至 2.88和 3.21,并且语音识别的错词率从 100%分别降低至 80.77%和 76.91%.同样,文中提出的主观错词率也有明显的下降.而在语音克隆的实验中,模型合成的重残聋哑人语音与其自身音色的相似度主观相似度意见评分达到3,且聋哑人语音的自然度主观意见评分和情感表达能力均得到了提高.

关键词：

语音合成语音转换语音克隆风格迁移

原文链接:

NETL
NSTL
万方数据

基于双通道特征融合网络的语音情感识别

周晓彦王丽丽邵勇斌鞠醒...

854-861页

查看更多>>摘要：针对语音情感识别中判别性的情感特征提取难题,结合卷积神经网络和视觉transformer网络结构,提出一种双通道特征融合的语音表征方法.使用基于倒瓶颈结构的卷积模块通道,并引入类transformer训练策略提取局部频谱特征,通过改进视觉transformer提取全局序列特征,利用卷积神经网络直接提取整个语谱图代替分块部分,更好地提取时序信息,将提取到的特征信息进行融合,能够获取判别性强的情感特征,最后输入到Softmax分类器得到识别结果.在EMO-DB和CASIA数据库上进行实验,文中所提模型的平均准确率分别达到了 94.24%和 93.05%,与其他模型进行对比试验,结果优于其他模型,表明了该方法的有效性.

关键词：

语音情感识别卷积神经网络视觉transformer特征融合

原文链接:

NETL
NSTL
万方数据

书讯

861页

原文链接:

NETL
NSTL
万方数据

基于鼾声特征的呼吸暂停低通气指数预测

叶自强彭健新

862-866页

查看更多>>摘要：打鼾是阻塞性睡眠呼吸暂停低通气综合征(obstructive sleep apnea hypopnea syndrome,OSAHS)患者最典型的症状,患者鼾声中含有重要诊断信息.文章从OSAHS患者整晚鼾声中提取了梅尔倒谱系数、线性预测系数、谱熵等声学特征参数,通过相关分析研究患者鼾声的特征参数与呼吸暂停低通气指数(apnea hypopnea index,AHI)的相关性,探讨基于梯度提升回归的AHI预测,并与其他模型进行对比.结果表明:谱熵和梅尔倒谱系数的某些维度与AHI具有较强的相关性,其相关系数大于 0.6.与线性模型相比,梯度提升回归模型表现出更好的预测效果,其预测的AHI与参考测量值之间的相关性高,相关系数为 0.813.结果表明,基于鼾声的声学特征预测OSAHS患者的AHI是可行的,对OSAHS的诊断具有较好的参考价值.

关键词：

阻塞性睡眠呼吸暂停低通气综合征鼾声呼吸暂停低通气指数声学特征梯度提升回归

原文链接:

NETL
NSTL
万方数据

教室言语可懂度主观评价方法实验对比

刘曦东祝培生宋嘉炜陶畹琪...

867-875页

查看更多>>摘要：言语可懂度是演讲厅音质评价的重要指标,当前已有多种演讲厅言语可懂度主观评价方法,但这些评价方法的结果差异较大.文章选取了对应于 4个不同语音传输指数(speech transmission index,STI),对 3类常用的言语可懂度主观评价方法(共 10种主观评价测试)进行了实验对比.结果表明:(1)相同STI值下不同评价方法的结果差异较大,并且听音条件越差,得分差异越明显,最大的差值达到了 54.1 个百分点.这种差异受多个因素的影响,主要有测试表的信息冗余度、应答方式、测试项数量、词句表种类等.(2)信息冗余度差异对单音节词表、双音节词表和句表的主观评价结果影响较大,3种方法之间的得分差值最大达到了 32.0个百分点,这种影响还随听音条件的变化而变化.(3)应答方式对押韵词表的主观评价结果影响较大,并且听音条件越差影响越大;对矩阵句表基本没有影响.(4)测试项数量会明显影响音位平衡单音节词表的难度和信度,测试词表的测试项数量越多,得分越低,同时标准差变小.(5)对于单音节词方法,词表种类对主观评价结果的影响相对较小;对于语句方法,句表种类在听音条件较差时对主观评价结果的影响较大,在听音条件较好时基本没有影响.相关结果可为演讲厅言语可懂度主观评价提供参考.

关键词：

教室言语可懂度单音节词表双音节词表句表语音传输指数(STI)

原文链接:

NETL
NSTL
万方数据

中低频宽带旁支管消声器设计

王超梅玉林王晓明

876-886页

查看更多>>摘要：设计了具有小尺寸的中低频宽带旁支管消声器.首先,应用传递矩阵法,建立了单旁支管消声器的声波传递损失数学模型;然后,以预设的共振频率为目标,计算单旁支管消声器的结构参数,并在分析结构参数对传递损失影响的基础上,择优建立旁支管消声单元;接着,将消声单元进行轴向和周向阵列,形成周期结构,研究周期性对消声性能的影响;最后,通过周期阵列具有不同共振频率的消声单元,设计了有效消声频带为 493～3 033 Hz的消声结构,同时借助旁支管侧支的弯曲,实现了结构的小尺寸设计.研究结果表明,轴向分支周期数不影响共振频率,但随着周向分支周期数的增加,结构共振频率会向高频滑动,且滑动幅度会逐渐减缓;轴向分支周期数和周向分支周期数的增加,都能显著提高旁支管消声器的有效消声带宽;通过采取侧支弯曲的设计,能减小消声器的结构尺寸,且对消声性能影响不大;综合利用轴向周期和周向分支周期阵列,以及采用组合具有不同共振频率旁支管单元的方法,能获得性能优异的中低频宽带消声器.

关键词：

旁支管消声器传递损失共振频率中低频宽带

原文链接:

NETL
NSTL
万方数据

多任务学习残差卷积网络的声源定位和深度估计方法

耿林张鸽王书海夏晨骏...

887-895页

查看更多>>摘要：针对基于平面麦克风阵列的声源定位方法难以估计声源深度的问题,文章提出了多任务学习残差卷积网络的声源定位和深度估计方法.提出的网络模型具有两个输出分支,分别用于实现声源定位和深度估计.该网络使用函数波束形成的成像结果作为输入特征.通过设计一种高分辨率并且无旁瓣的目标图作为网络的标签来提高函数波束形成声源识别性能,同时将声源面与测量阵列之间的距离均匀离散成不同的深度类别,根据网络输出的深度类别的概率来估计声源深度.仿真结果表明,所提方法在五种频率的测试集中定位准确率都不低于 96.95%,平均距离误差小于 0.0034 m,分类准确率大于 99.05%,能够准确定位声源并估计声源深度.此外,该方法在低信噪比情况下也能有效识别声源,具有良好的泛化性.

关键词：

声源定位深度估计多任务学习残差卷积网络函数波束形成

原文链接:

NETL
NSTL
万方数据

基于改进稀疏贝叶斯学习的时域信道参数估计方法

谈玉凡冯海泓李记龙梁金鑫...

896-906页

查看更多>>摘要：针对稀疏贝叶斯学习的信道估计方法在估计信道时延-多普勒二维参数时字典规模过大的问题,文章提出了一种改进的稀疏贝叶斯学习信道估计方法.首先采用匹配滤波器得到接收信号的模糊度函数;然后设置阈值并筛选大于阈值的信道响应,保留对应的索引和原子;接着利用保留的原子构建新的字典矩阵,同时构建相同规模的超参数矩阵;最后将保留的原子逐个代入稀疏贝叶斯学习算法进行超参数的迭代和收敛,最终得到信道冲激响应.该方法在不需要提前获知信道稀疏度的前提下,提高了信道参数估计的分辨率,相比传统的稀疏贝叶斯学习算法,大幅减小了计算量,使得采用稀疏贝叶斯学习算法估计二维时延-多普勒参数成为了可能.仿真结果表明,在预处理阈值设置合理的情况下,该方法相比原始稀疏贝叶斯学习算法,信道估计均方误差至少降低了约一个数量级,相比传统算法一次运算的时间大大缩短.

关键词：

时延-多普勒参数估计稀疏贝叶斯学习压缩感知模糊度函数

原文链接:

NETL
NSTL
万方数据