首页期刊导航|广东工业大学学报
期刊信息/Journal information
广东工业大学学报
广东工业大学
广东工业大学学报

广东工业大学

陈新

季刊

1007-7162

xbzrb@gdut.edu.cn

020-37626139

510090

广东省广州市东风东路729号

广东工业大学学报/Journal Journal of Guangdong University of TechnologyCSTPCD
查看更多>>本刊是由广东大学主办的自然科学学术期刊,前身为《广东工学院学报》,创刊于1984年,现为季刊,国内外公开发行,是美国《化学文摘》、俄罗斯《文摘杂志》及国内多家文摘期刊的源期刊,是中国科技论文统计源期刊,加入《中国期刊网》等数据库。本刊主要刊登机械、材料、电气、电子、自动化信息、计算机、化工、环境资源、建筑、基础学科及有关交叉学科等方面的学术论文、研究报告,并选登具有新见解的学术争鸣文章。
正式出版
收录年代

    说话人感知的交叉注意力说话人提取网络

    李卓璋许柏炎蔡瑞初郝志峰...
    91-101页
    查看更多>>摘要:目标说话人提取任务的目标是在一段混合音频中提取特定说话人的语音,任务设置上一般会给一段目标说话人注册音频作为辅助信息.现有的研究工作主要有以下不足:(1)说话人识别的辅助网络无法捕获学习注册音频中的关键信息;(2)缺乏混合音频嵌入和注册音频嵌入的交互学习机制.以上不足导致了现有研究工作在注册音频和目标音频之间存在较大差异时有说话人混淆问题.为了解决该问题,提出说话人感知的交叉注意力说话人提取网络(Speaker-aware Cross Attention Speaker Extraction Network,SACAN).SACAN在说话人识别辅助网络引入基于注意力的说话人聚合模块,有效聚合目标说话人声音特性的关键信息和利用混合音频增强目标说话人嵌入.进一步地,SACAN通过交叉注意力构建交互学习机制促进说话人嵌入与混合音频嵌入融合学习,增强了模型的说话人感知能力.实验结果表明,SACAN相比基准方法在STOI和SI-SDRi分别提高了0.0133、1.0695 dB,并在说话人混淆相关评估和消融实验中验证了不同模块的有效性.

    语音分离目标说话人提取说话人嵌入交叉注意力多任务学习

    嵌入拓扑特征的自然场景文本检测方法

    郑侠聪程良伦黄国恒王敬超...
    102-109页
    查看更多>>摘要:传统的基于锚点框(anchor box)实现的自然场景文本检测方法中,锚点框容易受到其他文本实例的干扰产生误判或精度降低,且文本实例包含强烈的拓扑特征但并未得到重视,导致在弯曲环形文本检测任务中表现不佳.针对这个问题提出了一种新颖的神经网络结构,引入图卷积神经网络的概念,充分考虑邻近锚点框之间的联系,并融入锚点框的拓扑特征辅助图神经网络的学习,提高整体网络的有效性.在两个公开的自然场景文本检测数据集上进行了消融实验,在公开数据集CTW1500中,本文提出的方法使模型在召回率、精确率、F分数这3个指标上分别提高了3.0%、1.9%以及2.5%,在公开数据集Totel-Text中这3个指标分别是2.2%、1.8%以及2.0%.此外,本文方法还与近年提出的其他文本检测算法进行了比较,实验结果证明本文提出的方法在复杂自然场景下文本检测效果优秀,所提出的模块有利于文本检测性能的提高.

    文本检测自然场景图神经网络拓扑特征

    双智能反射面辅助的绿色物联网边缘计算吞吐量研究

    陈彦龙曾祥李宇龙王丰...
    110-118页
    查看更多>>摘要:为解决计算密集型应用的终端物联网用户设备微电池能量难题,研究绿色可再生能量收集技术和双重构智能反射面技术赋能边缘计算,构建双智能反射面辅助的绿色物联网边缘计算系统,有效延长终端物联网用户设备计算寿命,提高系统计算吞吐量.首先,建立双智能反射面辅助的多用户级联衰落信道模型,建立绿色可再生能量收集的多时隙随机到达模型,建模物联网终端设备的能量供需因果约束条件.其次,以系统计算吞吐量最大化为准则,建模终端设备本地计算速率、边缘计算卸载功率、智能反射面相位的联合优化设计问题;该设计问题隶属一类复杂的非凸优化问题.为此,采用轻量级的多阶段优化技术,快速迭代设计本地计算、计算卸载、智能反射面相移等变量,完成绿色物联网边缘计算系统设计.实验结果表明,在较少的系统计算时间下,本文所提方案与基于半定松弛算法的性能增益相当,且优于已有的基准方案.

    边缘计算双智能反射面能量收集计算卸载

    智能反射面辅助认知无线携能通信次用户网络吞吐量优化

    乐文英崔苗张广驰
    119-130页
    查看更多>>摘要:为了提高认知无线携能通信(Simultaneous Wireless Information and Power Transfer,SWIPT)网络的频谱利用率并改善其能量受限情况,本文研究智能反射面(Intelligent Reflecting Surface,IRS)辅助的认知SWIPT网络,其中主用户网络以覆盖方式与次用户网络共享频谱,而次用户发射机同时为主用户发射机供能并与次用户接收机传输信息.提出次用户网络吞吐量优化算法,在满足次用户发射机的最大发射功率约束、主用户网络的最小吞吐量约束、总时隙约束以及智能反射面移约束的条件下,联合优化次用户发射机的波束成形矢量、时隙分配和智能反射面反射相移,最大化次用户网络吞吐量.该问题的优化变量相互耦合并且结构高度非凸,难以直接求解.所提算法采用交替优化、半正定松弛以及连续凸逼近方式,将原问题转化为三个子问题进行迭代求解.仿真结果表明与已有基准方案相比,所提算法能明显提高次用户网络的吞吐量.

    智能反射平面认知无线携能通信覆盖方式

    基于神经网络的HEVC帧内预测组合快速算法

    范俊宇宋立锋
    131-140页
    查看更多>>摘要:为了提升高效视频编码(High Efficiency Video Coding,HEVC)帧内编码的实时性能,本文提出的方法利用了引入偶数边长与步长的卷积核以及自注意力机制的轻量级卷积网络来预测编码树单元(Coding Tree Unit,CTU)的帧内划分结构,从而减少了编码器对CTU进行四叉树递归遍历划分的编码时间.原始编码策略中粗模式决策通过基于残差经哈德曼变换的预测残差绝对值总和(Sum of Absolute Transformed Difference,SATD)的损失值来估计率失真优化过程中的率失真损失值来进行加速,但仍会耗费一定的编码时间.提出一种方法通过采样搜索的方式减少粗模式决策过程中计算的模式数,从35种模式降低到了18种模式,降低了粗模式决策过程中计算估计损失值的时间.由粗模式决策过程得到的较优的多个候选帧内模式来进行率失真优化,为了缩减粗模式决策需要计算的候选模式数,在候选模式列表中根据前后帧内预测角度模式的估计损失值的差距来筛选掉部分可能性较低的候选模式实现早停止决策,从而减少需要进行率失真优化的候选模式数量,进而减少率失真优化过程的计算时间.本文提出的算法在测试序列上平均实现78.15%的编码时间缩减,BD-PSNR为-0.168 dB,BD-RATE为3.49%.

    视频编码神经网络帧内预测快速算法