首页期刊导航|计算机工程
期刊信息/Journal information
计算机工程
华东计算技术研究所 上海市计算机学会
计算机工程

华东计算技术研究所 上海市计算机学会

游小明

月刊

1000-3428

hdsce@sohu265359.sohuvip.net

021-54972331

200233

上海市桂林路418号

计算机工程/Journal Computer EngineeringCSCD北大核心CSTPCD
查看更多>>本刊是中国电子科技集团公司第三十二研究所(华东计算技术研究所)主办的学术性刊物,是上海市计算机学会会刊。主要特点:以最快的速度、科学求实的精神,精选刊登代表计算机行业前沿科研、技术、工程方面的高、精、尖优秀论文。贯彻党的“双百”方针,繁荣科技创作,促进国内外学术交流,探讨和传播计算机科学的理论和实践,加速和促进我国计算机事业的发展。
正式出版
收录年代

    一种深度学习的波束空间信道估计算法

    郑娟毅张庆珏董嘉豪郭梦月...
    298-305页
    查看更多>>摘要:在时分双工(TDD)毫米波大规模多输入多输出(MIMO)系统中,因为波束空间信道具有稀疏性,导致将低维测量数据重建为原始高维信道时会带来较高的复杂度。针对上行链路,在不考虑稀疏度的情况下,将传统优化算法和基于数据驱动的深度学习方法相结合,提出一种改进的基于深度学习的波束空间信道估计算法。从重建过程入手,通过交替建立梯度下降模块(GDM)和近端映射模块(PMM)来构建网络。首先根据Saleh-Valenzuela 信道模型进行理论公式推导并生成信道数据;其次构建一个由传统迭代收缩阈值算法(ISTA)的更新步骤所展开的多层网络,并将数据传输到该网络,每层对应于一次类似ISTA的迭代;最后对训练好的模型进行在线测试,恢复出待估计的信道。构建PyTorch环境,将该算法与正交匹配追踪(OMP)算法、近似消息传递(AMP)算法、可学习的近似消息传递(LAMP)算法、高斯混合LAMP(GM-LAMP)算法进行对比,结果表明:在估计精度方面,所提算法相对表现较好的深度学习算法LAMP、GM-LAMP分别提升约3。07和2。61 dB,较传统算法OMP、AMP分别提升约11。12和9。57 dB;在参数量方面,所提算法较LAMP、GM-LAMP分别减少约39%和 69%。

    大规模多输入多输出系统稀疏信道估计压缩感知深度学习迭代收缩阈值算法无线通信

    基于流量自相似性的网络队列管理算法

    魏德宾杨力潘成胜沈婷...
    306-312页
    查看更多>>摘要:网络流量的自相似性会导致数据突发状态持续,传统队列管理算法无法对网络流量突发状态进行预测,从而影响网络端到端时延、丢包率和吞吐性能。针对该问题,提出一种基于网络流量预测的主动队列管理算法P-ARED。基于网络流量的均值和方差给出网络流量等级的概念,讨论网络流量等级转移概率与Hurst参数之间的关系,提出基于贝叶斯估计思想的网络流量等级预测方法。在此基础上,在对自相似网络流量环境下的平均队列长度、缓存队列长度最小阈值等参数优化设置的基础上,基于Hurst参数和自相似流量等级预测结果,重新设计ARED算法中分组丢弃概率的计算方法,以提高缓存队列长度的稳定性。仿真结果表明,P-ARED算法与对比的主动队列管理算法相比,降低了网络端到端时延和丢包率,提高了端到端吞吐性能,其中平均吞吐量最高提升7。63%,平均时延最多降低17。52%。

    网络流量自相似性主动队列管理随机早期检测流量等级

    多基站无线非正交多址接入的平滑视频流传输算法

    朱志强徐朝农朱东辉
    313-322页
    查看更多>>摘要:视频服务需求的快速增长对于视频流畅播放提出了巨大挑战,从用户体验角度分析,视频播放中的卡顿时间可能是最重要指标之一。随着5G网络技术的发展,非正交多址接入(NOMA)技术被重点关注,NOMA技术具有叠加编码和连续干扰消除2个特点,根据这2个特点实现数据的并行传输。利用NOMA技术的并行传输能力来提高基站为用户提供视频的实时性。在用户需求视频名称和视频分辨率给定的情况下,通过联合基站-用户配对方式和基站功率分配来降低视频播放时的卡顿时间。通过对问题进行建模,并提出1个两步启发式算法对问题进行求解,第1步为确定基站与用户的配对方式,第2步为分配基站的发射功率。实验结果表明,基于NOMA的传输调度方案与传统的传输调度方案相比,用户需求的平均卡顿时间有明显的下降,相对于在不采用NOMA机制时,在2-SIC接收机情况下,用户平均卡顿时间减少了 55。56%。

    卡顿时间非正交多址接入视频传输叠加编码功率分配

    虚拟脊柱侧凸病例腰椎自动生成方法

    赵逸飞张俊华
    323-329页
    查看更多>>摘要:统计形状模型(SSM)是一种描述可变形物体形态学变化的模型,被广泛应用于三维(3D)肝脏分割、3D脊柱生成等任务。针对现有SSM在生成虚拟青少年特发性脊柱侧凸(AIS)腰椎病例数据时存在生成结果不真实且对AIS病例适用性较差的问题,提出一种基于三维变分自编码生成式对抗注意力网络(3D-VGAN)的虚拟AIS腰椎自动生成方法。3D-VGAN模型由编码器、生成器和判别器组成,编码器和生成器在变分自编码器(VAE)模型的基础上结合空间注意力机制提取数据特征,同时利用残差模块解决了神经网络训练过程中的网络退化问题。为了克服生成-判别结构的3D-VGAN模型中存在的稳定性不强、生成器与判别器训练速度不匹配的问题,使用阈值训练法对3D-VGAN模型进行训练,提升了稳定性。在基于43例AIS病例腰椎3D模型的数据集上的实验结果表明:3D-VGAN模型在病例重建实验中的结构相似性(SSIM)系数为0。999 62,相比3D-VAE、3D-变分自编码生成式对抗注意力网络(VAEGAN)和SSM模型分别提高了 0。080 09%、0。002 00%、0。122 20%;在病例生成实验中的弗雷歇初始距离(FID)系数为 275。653 48,相比 3D-VAE、3D-VAEGAN 和 SSM 模型分别降低了 8。420 55%、0。977 73%、7。319 27%。上述实验结果验证了 3D-VGAN模型通过注意力机制、残差模块和阈值训练法取得了更好的虚拟AIS病例腰椎数据生成性能。

    青少年特发性脊柱侧凸生成式对抗网络统计形状模型图像生成深度学习

    针对大角度下视角差异的行人重识别方法研究

    蔡毅翔秦品乐曾建潮晋赞霞...
    330-341页
    查看更多>>摘要:行人重识别(Re-ID)也称为行人再识别,旨在给定一个目标行人,确定该行人是否出现在不同的摄像机下,或者是在不同的时间出现在相同的摄像机下。通常由于不同摄像机拍摄到的行人视角不同,在视角差异过大的情况下会对行人重识别准确率造成严重影响。因此,针对目标行人相对摄像机的视角不同而带来的识别率下降问题,提出一种基于外观-步态特征融合的行人重识别算法,使用视角信息对RGB图像与步态能量图(GEI)进行重要性权重估计后再加权融合,以此来克服视角不同而带来的影响。具体来讲,首先利用ResNet-50提取图像序列中每张图像的特征,采用时间池化的方式将其聚合为外观特征。其次使用另一个ResNet-50对GEI图像提取步态特征。然后对行人进行视角估计之后,映射函数将估计的角度映射为两种特征的重要性权重。最后基于自编码器结构将两种特征在重要性权重的指导下进行加权融合,生成对视角鲁棒的融合特征。在CASIA-B数据集上的实验结果表明,对于具有大角度视角差异的行人Re-ID,所提出方法在mAP和Rank-1评估指标上都表现出了显著的改进。在大角度差异情况下进行测试,准确率最高提升了 2。7%。

    行人重识别视角差异外观特征步态特征特征融合

    融合动态特征与注意力的敦煌壁画修复模型

    刘仲民严梁
    342-353页
    查看更多>>摘要:敦煌壁画图像含有丰富的纹理和结构信息,在破损壁画修复过程中,容易忽略受损特征信息与完整特征信息之间的区别,从而误导修复过程生成不合理的壁画内容。针对该问题,提出一种融合动态特征选择和像素级通道注意力的壁画修复模型。设计基于U-Net的网络生成器,实现对破损图像的编码与解码操作;采用有效可迁移卷积模块,通过动态选择采样空间位置,实现对有效特征信息的灵活提取,采用区域综合归一化模块减少修复区域与完整区域的期望和方差的偏移,从而加强对有效特征信息的选择和利用;在解码层设计像素级通道注意力模块,在增强有效特征权重的同时使模型可从相隔较远的空间位置学习有效特征。在敦煌壁画数据集上的实验结果表明,该算法能够利用有效信息修复掩膜区域比例不一的不规则破损壁画图像,相比PConv、PRVS、DSNet算法,在峰值信噪比(PSNR)指标上平均提升0。502 dB,在结构相似性(SSIM)指标上平均提升1。384%。

    信息处理技术壁画修复深度学习有效特征选择注意力机制

    东北亚舆情文本细粒度命名实体识别方法研究

    隗昊刁宏悦孔亮宸邓耀臣...
    354-362页
    查看更多>>摘要:东北亚地区的国际形势变化与中国的发展密切相关,面向该地区构建舆情信息知识图谱可以有效地监测舆情热点,这不仅能够引导社会舆论健康发展及协助政府决策,而且对防范政治营销、提升国家语言能力、构建和谐稳定国际关系具有重大价值。命名实体识别是构建知识图谱的关键技术和核心任务,受到研究者广泛的关注。以社交媒体、门户网站与东北亚地区相关的实时热点舆情文本作为数据源,充分考虑到东北亚地区的区域特点和地缘结构,建立包含10个大类、35个子类的细粒度命名实体识别数据集,并提出基于预训练语言模型RoBERTa和多层残差BiLSTM-CRF架构(RoBERTa-ResBiLSTM-CRF)的舆情实体识别模型,同时在模型完成标签预测后设计基于规则模板的后处理策略,以提高整体的实体识别性能。实验结果表明,所提出的舆情命名实体识别模型的性能优于主流的传统神经网络模型,验证了该方法的有效性。

    细粒度命名实体识别舆情文本深度学习预训练语言模型

    多病种眼底疾病诊断的深度学习策略讨论

    宫阿娟潘天荣
    363-372页
    查看更多>>摘要:深度学习算法可实现精准的眼底疾病诊断,对眼底疾病的早期诊断和及时干预具有重要意义。近年来涌现出多种深度学习诊断算法,在数据扩增、图像增强、训练策略、特征提取等方面提出了改进设计,但对眼底疾病这样的多病种诊断问题,采用哪种训练策略缺乏系统的分析。从数据处理、训练测量、网络模型、注意力机制等方面分析不同策略的性能,为多种疾病诊断提供深度学习算法设计依据:独立训练后综合投票法的结果优于集中训练法,但训练成本更高;在训练集上,集中训练法的表现差异不大,但在验证集上,ResNeSt50的表现最佳,具有良好的泛化能力;单病种独立训练的二分类预测结果明显优于多病种的综合分类,表明优化分类网络结构有助于提高类别特征的分类效果。未来可考虑设计融合临床知识的专用网络结构进行特定细节增强,强化类间特征差异,使模型具有一定的可解释性,并提高诊断的准确率。这种多层融合网络设计将是眼科疾病诊断的发展方向之一。

    深度神经网络投票器注意力机制数据增强模型优化

    投稿指南

    《计算机工程》编辑部
    封3页