首页期刊导航|高技术通讯
期刊信息/Journal information
高技术通讯
中国科学技术信息研究所
高技术通讯

中国科学技术信息研究所

赵志耘

月刊

1002-0470

hitech@istic.ac.cn

010-68598272

100045

北京市三里河路54号

高技术通讯/Journal Chinese High Technology LettersCSCD北大核心CSTPCDEI
查看更多>>《高技术通讯》创刊于1991年,是由国家科技部高技术研究发展计划(863计划)联合办公室创办、中国科学技术信息研究所主办的综合性学术刊物,是国内高技术领域的高层次学术刊物之一。内容涉及计算机、现代通讯、机器人、先进制造与自动化技术、新材料、能源、生物、海洋及其他高技术领域。本刊注重研究的新思路、新理论、新方法和新技术的择文标准,使其具有学术性、前沿性、可读性和资料性。其宗旨是为我国研究人员及时发表其研究成果和进行国内、国际学术交流提供园地,促进我国高技术研究的发展和扩大其在国内外的影响。本刊为美国《化学文摘》(CA)、 英国《科学文摘》(SA)及俄罗斯《文摘杂志》、荷兰《Scopus》、《中国科学引文数据库》、《中国科技论文统计与分析》等收录源期刊。  
正式出版
收录年代

    基于动态压缩的高存储效率末级分支目标缓冲

    谭弘泽王剑
    671-680页
    查看更多>>摘要:随着软件系统规模及复杂度的增长,数量庞大的指令使指令高速缓存和分支目标缓冲(BTB)频繁地发生缺失,导致中央处理器(CPU)性能下降。现代工业CPU设计在分离式前端中使用充分大的多级BTB以减少缺失导致的性能损失。由于实际芯片的存储资源有限,大容量的末级BTB需要更高的存储效率。然而,现有压缩BTB采用静态分配目标偏移量存储空间的方法,无法按照分支的实际存储需求进行调整,导致其存储效率较低。针对上述问题,提出一种基于动态压缩的BTB——ZBTB。ZBTB通过可变长编码表示目标偏移量,动态分配目标偏移量存储空间,结合无额外存储的最近最少使用(LRU)和偏斜相联等方法缓解冲突,提升了存储效率。基于以第1届指令预取锦标赛(IPC-1)所发布轨迹数据进行的评估,与现有BTB相比,ZBTB在33。5 kB容量下可将误预测次数降低66%。

    分支预测分支目标缓冲(BTB)压缩偏斜相联

    基于无裁剪图形流水线的三维图形处理器

    赵皓宇王重熙宋鹏皓章隆兵...
    681-691页
    查看更多>>摘要:传统的三维图形处理器通过裁剪操作获取三角形的可见区域。然而,裁剪操作的延迟长且硬件开销高,大量的裁剪操作会降低图形处理器的性能。本文设计了一款基于OpenGL ES 2。0标准的三维图形处理器芯片,采用了统一渲染架构。该图形处理器采用高效的无裁剪图形流水线结构,消除了裁剪所带来的硬件开销和性能损耗。此外,本文为该图形处理器设计了一个符合IEEE-754标准的三维向量内积(DP3)计算单元,用于固定功能流水线,以提高图形处理器的性能,并消除图形渲染过程中浮点乘加操作的误差,增强了图形处理器的图形渲染鲁棒性。该三维图形处理器每秒能够处理500 M个顶点和8 G个纹素,功耗为1 000 mW,采用了 28 nm工艺,面积为7。92 mm2。实现结果表明,与之前的工作相比,本文设计的图形处理器的性能-功耗比提高了 27。8%。

    三维图形处理器图形流水线裁剪向量内积

    融合全局聚合与局部挖掘的建筑图像检索

    孟月波张紫琴刘光辉徐胜军...
    692-704页
    查看更多>>摘要:针对建筑图像易受到尺度变化和局部遮挡干扰而导致检索准确率低的问题,本文提出了一种融合全局聚合与局部挖掘的建筑图像检索网络。以ResNet50为骨干网络并在其后引入多尺度特征聚合的全局分支和注意力引导特征挖掘的局部分支,再通过正交融合策略高效整合双分支互补特征。其中,多尺度特征聚合模块结合混合空洞卷积和通道注意力对全局不同尺度的目标进行自适应加权聚合,增强网络对建筑多尺度显著特征的提取;注意力引导特征挖掘模块通过信息互补注意力对最显著特征标记擦除,实现对局部区域中潜在的细节信息的挖掘。所提方法在主流建筑数据集ROxf和RPar上的平均精度均值(mAP)指标分别达到了 81。54%(M)、62。43%(H)和 90。28%(M)、78。35%(H)。实验结果表明,该方法有效克服了尺度变化和局部遮挡的干扰,显著提升了建筑图像检索的准确率。

    建筑图像图像检索特征聚合特征挖掘

    基于精度因子与距离残差的加权最小二乘算法在DTMB辅助北斗定位中的应用

    李旋杨海效李济源翟悦峰...
    705-713页
    查看更多>>摘要:北斗三号系统已完成建设,该系统可以在空旷的室外提供较为准确的定位信息。但是在城市峡谷区域,北斗信号会受到遮挡。当能够提供有效定位信息的北斗卫星数目逐渐减少时,利用北斗卫星进行定位得到的定位结果偏差会逐渐增大。本文针对以上问题,在采用地面数字多媒体广播信号辅助北斗定位的基础上,利用基于精度因子与距离残差的加权最小二乘算法进行定位,相比于利用最小二乘算法进行定位,定位精度提高了40%~50%。本文提出的算法对于解决定位基站数目不足时增加其他不同类型基站来进行辅助定位的问题具有借鉴作用。

    改进的加权最小二乘算法精度因子距离残差辅助定位

    针对深度学习中不规则内存访问的高吞吐内存管理单元

    丁峰李曦
    714-725页
    查看更多>>摘要:人工智能应用的多样化与复杂化导致了算法模型的不规则内存访问,即集中突发的访问请求与稀疏的访问地址,从而给智能应用在内存资源严格受限的移动端设备的部署带来了挑战。这种不规则的内存访问导致了现有架构中内存管理单元(MMU)的地址转换面临低吞吐和长延迟的问题,使其成为系统访存通路的瓶颈。针对上述问题,本文提出了一种新的高吞吐MMU架构方案(HTMMU),通过多流并行,加强冗余请求的过滤,合理地分配有限的片上存储资源等手段,从而能高吞吐、低延迟地处理不规则访问的地址转换,提升系统访存效率。实验结果表明,在处理人工智能算法内突发的稀疏访存时,相较于当前主流MMU设计方案,HTMMU平均获得了 2。43倍的性能提升,而平均访问延迟降低为原先的34。1%,同时将额外面积开销控制在3。0%以内。

    内存管理单元(MMU)地址转换不规则访存深度学习高吞吐

    基于三维卷积时空融合网络的压缩视频质量增强算法

    黄威威贾克斌
    726-733页
    查看更多>>摘要:视频数据在存储与网络传输时,通常使用标准压缩算法对原始视频进行压缩。针对压缩后视频存在压缩伪影导致视频质量下降的问题,本文提出一种基于深度学习的后处理方法提高压缩视频质量。首先,提出一种新的三维卷积时空融合网络(3D-CSTF),通过三维卷积的滤波特性提取连续视频帧之间的时空信息,并利用视频帧之间信息的强相关性来提高视频质量。其中,设计了一种用于映射和提取视频帧特征的质量增强网络(Qe-Net)。其次,将7个连续的视频帧送到网络进行端到端训练,利用前3帧和后3帧的信息增强当前帧。最后,在MFQE数据集上进行训练和测试。实验结果表明,该方法在视频质量评估标准峰值信噪比(PSNR)上取得了良好的性能。当量化参数(QP)等于37、32、27和22时,相比压缩后的视频,PSNR分别增加0。82 dB、0。83 dB、0。79 dB和0。74dB。

    3D卷积视频质量增强多帧信息深度学习

    受限密集环境下基于对比学习和强化学习的机器人导航方法

    禹鑫燚胡加南郑万财欧林林...
    734-743页
    查看更多>>摘要:动态环境下的机器人导航是一个重要且具有挑战性的任务。针对机器人在受限密集环境下的导航任务,本文提出了一种基于深度强化学习(DRL)和对比学习结合的机器人导航方法。首先通过轨迹向量化方法来获取机器人和行人的历史信息,并设计了一个子图网络对其进行聚合,从而提高机器人对未来场景的预测能力。其次通过图神经网络(GNN)提取智能体(机器人、行人)之间的交互信息,赋予机器人预测行人意图的能力。最后在强化学习的基础上融入对比学习,并基于随机性策略强化学习算法性质提出了一种正样本增强方法,从而赋予机器人判断场景中其余位置安全性的能力以及找到更多可行路径的能力,提高其在复杂环境中的导航成功率。仿真实验验证了本文方法在受限密集环境中比现有的方法具有更好的性能。

    深度强化学习(DRL)对比学习机器人导航人机交互

    基于片上系统的可配置卷积神经网络加速器的设计与实现

    张立国杨红光金梅申前...
    744-754页
    查看更多>>摘要:针对现阶段卷积神经网络(CNN)加速器的设计只能部署在单一现场可编程门阵列(FPGA)平台、不支持硬件平台升级迭代的问题,设计了一种基于片上系统(SoC)的可配置CNN加速器。该加速器具备以下2个特点:(1)在电路设计中将数据位宽、中间缓存空间大小、乘法器阵列(MAC)并行度作为一种可选配置参数,通过调整资源使用量,使得该加速器能够适配不同FPGA硬件;(2)提出了动态数据复用的策略,通过对比数据传输过程中不同复用方式下的总参数量差异,动态地选择复用方法,以减少数据传输的等待时间,提高乘法器阵列利用率。该方案在ZCU104板卡上进行了实验,实验结果表明,当数据位宽选择8、乘法器阵列并行度选择1 024、核心运算模块工作在180 MHz时,卷积运算阵列峰值吞吐量为180 GOPs,功耗为3。75 W,能效比达到47。97 GOPs。W-1,对于VGG16网络,其卷积层的平均乘法器阵列利用率达到84。37%。

    卷积神经网络(CNN)现场可编程门阵列(FPGA)CNN加速器可配置异构加速

    基于双深度Q网络算法的多用户端对端能源共享机制研究

    武东昊王国烽毛毳陈玉萍...
    755-764页
    查看更多>>摘要:端对端(P2P)电力交易作为用户侧能源市场的一种新的能源平衡和互动方式,可以有效促进用户群体内的能源共享,提高参与能源市场用户的经济效益。然而传统求解用户间P2P交易的方法依赖对于光伏、负荷数据的预测,难以实时响应用户间的源荷变动问题。为此,本文建立了一种以多类型用户为基础的多用户P2P能源社区交易模型,并引入基于双深度Q网络(DDQN)的强化学习(RL)算法对其进行求解。所提方法通过DDQN算法中的预测网络以及目标网络读取多用户P2P能源社区中的环境信息,训练后的神经网络可通过实时的光伏、负荷以及电价数据对当前社区内的多用户P2P交易问题进行求解。案例仿真结果表明,所提方法在促进社区内用户间P2P能源交易共享的同时,保证了多用户P2P能源社区的经济性。

    端对端(P2P)能源共享强化学习(RL)能源交易市场双深度Q网络(DDQN)算法

    基于改进YOLOv8的无人机图像小目标检测算法

    李云文冯宇平安文志赵军...
    765-775页
    查看更多>>摘要:针对无人机(UAV)图像中目标尺寸小及特征信息少导致检测精度低的问题,提出改进YOLOv8n的小目标检测算法。首先,引入Wise-IoU损失函数,通过动态非单调聚焦机制增强网络对普通质量锚框的关注,提高泛化能力。然后,添加小目标检测层(SODL)和双向特征金字塔网络(BiFPN)构建新的特征融合结构——Bi-SODL结构。SODL使网络更充分地捕捉小目标的浅层特征信息,BiFPN可以实现不同尺度特征层之间的信息交流和融合,提高小目标检测的准确性。最后,添加大型可选择模块(LSKBlock)注意力机制,通过空间选择机制和加权方式对输入特征进行处理,进一步提高小目标检测的性能和鲁棒性。实验结果表明,在VisDrone2019数据集上的检测精度指标P、mAP_0。50和mAP_0。50∶0。95分别提升6。4%、8。3%和5。2%,并且参数量降低25。78%。改进措施使得检测性能优于众多主流算法,证明了改进算法的有效性。

    小目标检测YOLOv8n特征融合注意力机制