首页期刊导航|计算机科学
期刊信息/Journal information
计算机科学
计算机科学

朱完元

月刊

1002-137X

jsjkx12@163.com

023-63500828

401121

重庆市渝北区洪湖西路18号

计算机科学/Journal Computer ScienceCSCD北大核心CSTPCD
查看更多>>本刊的读者对象是:大专院校师生,从事计算机科学与技术领域的科研、生产人员。办刊宗旨是:坚持“双百”方针,活跃计算机科学与技术领域的学术气氛,重点报导国内外计算机科学与技术的发展动态,为我国的计算机科学与技术立于世界之林、达到国际先进水平奋斗而矢志不渝。
正式出版
收录年代

    基于重复数据删除的分层存储优化技术研究进展

    姚子路付印金肖侬
    120-130页
    查看更多>>摘要:随着全球数据量的爆炸式增长以及数据多样性的日益丰富,单一介质层的存储系统逐渐不能满足用户多样化的应用需求.分层存储技术可依据数据的重要性、访问频率、安全性需求等特征将数据分类存放到具有不同访问延迟、存储容量、容错能力的存储层中,已经在各个领域得到广泛应用.重复数据删除是一种面向大数据的缩减技术,可高效去除存储系统中的重复数据,最大化存储空间利用率.不同于单存储层场景,将重复数据删除技术运用于分层存储中,不仅能减少跨层数据冗余,进一步节省存储空间、降低存储成本,还能更好地提升数据I/O性能和存储设备的耐久性.在简要分析基于重复数据删除的分层存储技术的原理、流程和分类之后,从存储位置选择、重复内容识别和数据迁移操作3个关键步骤入手,深入总结了诸多优化方法的研究进展,并针对基于重复数据删除的分层存储技术潜在的技术挑战进行了深入探讨.最后展望了基于重复数据删除的分层存储技术的未来发展趋势.

    重复数据删除分层存储存储位置选择重复内容识别数据迁移

    面向NewSQL数据库数据协同持久化的研究

    左顺李永坤许胤龙
    131-141页
    查看更多>>摘要:现代NewSQL数据库为了提供数据的高可用性,通常会为数据提供多个副本,以便在某个副本不可用时,可以从其他的副本中获取数据.而在数据多副本的情况下,又需要考虑副本间的数据一致性问题,即在某一时刻不同客户端读取某个数据时得到的结果应该是相同的,因此引入了事务处理机制.在一个包含多个写操作的交互式事务处理过程中,由于数据存在多个副本,因此每个写入操作需要对所有的主备副本进行写入操作.然而主备副本通常分散在不同的机器上,因此会引入写远端副本的时延,其最终将会增大整个事务的处理时延.针对该问题,提出了数据协同持久化的方案,其主要思想是让客户端在本地缓存事务的写操作日志,在最终提交事务时,客户端首先将事务中的写操作日志进行持久化,并将该日志发送给事务的协调者节点,让协调者进行日志数据的分发处理,从而达到两者协同持久化事务数据的目的.实验结果表明,相较于同步持久化方案,协同持久化方案不仅能降低交互式事务处理的时延,还能提高约38%左右的系统极限吞吐率.

    分布式数据库并发控制数据持久化数据一致性高数据竞争负载

    序列标签推荐

    刘冰徐鹏宇陆思进王诗菁...
    142-150页
    查看更多>>摘要:随着互联网技术的发展以及社交网络的扩大,网络平台已经成为人们获取信息的一个重要途径.标签的引入提升了信息分类及检索效率.同时,标签推荐系统的出现不仅方便了用户输入标签,还提高了标签的质量.传统的标签推荐算法通常只考虑标签和项目两个主体,而忽略了用户在选择标签时个人意图所起到的重要作用.由于在标签推荐系统中标签最终由用户确定,因此用户的偏好在标签推荐中起着关键作用.为此,引入用户作为主体,并结合用户发布的历史帖子的先后顺序,将标签推荐任务建模为更加符合真实场景的序列标签推荐任务.提出了一种基于MLP的序列标签推荐方法(MLP for Sequential Tag Recommendation,MLP4STR),该方法显式地建模用户偏好用于引导整体标签推荐.MLP4STR采用一种跨特征对齐的MLP序列特征提取框架,将文本和标签的特征对齐,获取用户的历史帖子信息和历史标签信息中隐含的用户动态兴趣.最后,结合帖子内容和用户偏好进行标签推荐.在4个真实世界的数据集上得到的实验结果表明,MLP4STR能够有效地学习序列标签推荐中的用户历史行为序列的信息,其中,评价指标F1@5较最优的对比算法有显著提升.

    标签推荐序列推荐多标签学习用户偏好

    面向远程内存图数据库的应用感知分离式存储设计

    李纯羽邓龙李永坤许胤龙...
    151-159页
    查看更多>>摘要:图数据在各种应用中日益普及,其因涵盖多种实体类型和存在丰富的关联关系而备受关注.对于图数据库用户而言,高效的图查询服务是保障系统性能的关键因素.随着数据量增加,单机图数据库很难满足将所有数据存储在内存中的需求,而分布式图数据库在拓展性和资源利用率方面受到挑战.基于RDMA的远程内存系统的引入为克服这些挑战提供了一种新的选择,通过分离计算和存储资源,实现了更为灵活的内存使用方式.然而,在使用远程内存的情况下如何最大程度地优化图查询性能成为了当前研究的重点问题.文中首先分析了利用操作系统分页机制透明使用远程内存构建图数据库存在的问题,并在应用层次上设计了远程内存图数据库的存储模型.根据不同数据的特点和访问模式,设计了属性图在远程内存中的存储结构,优化了数据布局和访问路径.实验结果表明,在本地内存受限的情况下,与透明使用远程内存相比,应用感知的设计方式的端到端性能最高提升了 12倍.

    图查询图数据库图存储远程内存属性图模型

    路径掩码自编码器引导无监督属性图节点聚类

    丁新宇孔兵陈红梅包崇明...
    160-169页
    查看更多>>摘要:图聚类的目的在于发现网络的社区结构.针对目前聚类方法无法很好地获取网络深层潜在社区信息,且不能对特征进行合适的信息整合导致节点社区语义不清晰的问题,提出了一种路径掩码自编码器引导无监督属性图节点聚类模型(Path-Masked Autoencoder Guiding Unsupervised Attribute Graph Node Clustering,PAUGC).该模型通过对网络进行随机路径掩码后使用自编码器来深度挖掘网络拓扑结构,从而获得良好的全局结构语义信息,利用规范性方法来对特征进行信息整合,使节点特征能够更好地表征特征的类别信息.此外,模型结合模块最大化来抓取整个图中的底层社区群落信息,目的在于更合理地将其融合到低维度节点特征中.最后通过自训练聚类来不断迭代优化更新聚类表示以获得最终的节点特征.通过在8个基准数据集上与11种经典方法进行大量实验对比,证明了 PAUGC的有效性.

    深度图聚类无监督学习特征信息整合模块最大化聚类自训练

    融合时频特征的多粒度时间序列对比学习方法

    叶力硕何志学
    170-182页
    查看更多>>摘要:现有的时间序列对比学习方法存在增强样本构造方式过于依赖人工经验、泛化能力不足、正样本的定义方式不够通用、对比度量方式存在粗粒度表征等问题,使得整体的时序表示效果较差.为此,提出了一种融合时频特征的多粒度时间序列对比学习方法(Temporal-Spectral Deep Contrastive Network,TSDC).该方法通过季节-趋势生成网络在时域内产生具有稳定变化的时序增强样本,通过多频带融合扰动操作在频域内产生非稳定变化的时序增强样本,两种增强样本通过实例级别的粗粒度对比以及维度级别的细粒度对比方式进行对比学习,使得模型在获得较好表征的同时能够较好地适应于下游不同类型的时序任务.在多个时间序列公开数据集上进行的分类、预测以及异常检测实验表明,由TSDC方法所得的表征用于下游任务的结果优于典型基线模型.

    时间序列表示学习对比学习数据增强多粒度对比

    联邦学习在医学图像处理任务中的研究综述

    刘育铭代煜陈公平
    183-193页
    查看更多>>摘要:在医学领域,由于患者隐私问题,图像很难集中收集和标注,这给深度学习模型的训练和部署带来了较大困难.联邦学习作为一种能有效保护数据隐私的分布式学习框架,能够在参与方不共享数据的基础上进行联合建模,从技术上打破数据孤岛,其凭借这些优势在许多行业已经得到广泛应用.由于与医学图像处理的需求高度契合,近年来也涌现出许多应用于医学图像处理的联邦学习研究,然而大部分新的方法仍未被归纳分析,不利于后续的进一步探索.文中对联邦学习进行了简单的介绍,列举了其在医学图像处理方面的部分应用,并根据改进的方向对目前已有的研究进行了分类总结.最后,讨论了目前医学图像方向联邦学习所面临的问题和挑战,并对未来的研究方向进行了展望,希望给后续研究提供一定的帮助.

    联邦学习医学图像深度学习图像处理分布式学习隐私保护

    视觉Transformer(ViT)发展综述

    李玉洁马子航王艺甫王星河...
    194-209页
    查看更多>>摘要:视觉Transformer(Vision Transformer,ViT)是基于编码器-解码器结构的Transformer改进模型,已经被成功应用于计算机视觉领域.近几年基于ViT的研究层出不穷且效果显著,基于该模型的工作已经成为计算机视觉任务的重要研究方向,因此针对近年来ViT的发展进行概述.首先,简要回顾了 ViT的基本原理及迁移过程,并分析了 ViT模型的结构特点和优势;然后,根据各ViT变体模型的改进特点,归纳和梳理了基于ViT的主要骨干网络变体改进方向及其代表性改进模型,包括局部性改进、结构改进、自监督、轻量化及效率改进等改进方向,并对其进行分析比较;最后,讨论了当前ViT及其改进模型仍存在的不足,对ViT未来的研究方向进行了展望.可以作为研究人员进行基于ViT骨干网络的研究时选择深度学习相关方法的一个权衡和参考.

    计算机视觉模式识别VisionTransformer(ViT)深度学习自注意力

    面向工业品缺陷检测的对比表示学习

    罗航宇王小平梅萌赵文豪...
    210-220页
    查看更多>>摘要:在大规模制造业中,缺陷检测旨在发现有缺陷的零部件,如损坏、错位的和存在印刷错误的部件等.由于缺陷类型未知以及缺陷样本短缺,工业品缺陷检测面临着极大的挑战.为克服上述困难,一些方法利用来自自然图像数据集的通用视觉表示,提取广义特征来进行缺陷检测.然而,提取到的预训练特征与目标数据之间存在分布差异,直接使用该特征会导致检测性能不佳.因此,提出了一种基于对比表示学习的方法ConPatch.该方法采用对比表示学习来收集相似特征或者分离不相似特征,从而学习面向目标的特征表示.为了解决缺乏缺陷标注的问题,将数据表示之间的两种相似性度量即成对相似度和全局相似度作为伪标签.此外,采用了轻量化的内存库,仅将全部正常样本即全部无缺陷样本的特征中心存储到内存库中,从而减小了空间复杂度和内存库的尺寸.最后,将正常特征拉近至一个超球面内,而缺陷特征则分布在超球面外,以此来聚集正常特征.实验结果显示,在工业品缺陷检测数据集 MVTec AD中,基于 Wide-ResNet50的ConPatch模型的I-AUROC和P-AUROC分别达到99.35%和98.26%.在 VisA数据集中,ConPatch模型的I-AUROC和P-AUROC分别达到95.50%和98.21%.上述结果验证了模型的有效性.

    工业品缺陷检测对比表示学习相似性度量内存库超球面

    基于双流融合网络的非接触式IR-UWB人体动作识别方法

    张传宗王冬子郭政鑫桂林卿...
    221-231页
    查看更多>>摘要:随着智能感知技术的飞速发展,人机交互(Human Computer Interaction,HCI)领域迎来了全新的发展态势.传统的人机交互方法主要依赖可穿戴设备或者摄像头采集用户的行为数据,虽然识别精准,却存在不小的局限性.具体而言,可穿戴设备会给用户带来额外的使用负担,而基于摄像头的方案不仅会受到环境光线的影响,还会涉及用户隐私的泄露,这些因素均限制了其在日常生活中的广泛应用.为了突破这些限制,实现精确的、非接触式人机交互应用,利用无线射频(Radio Frequency,RF)领域中脉冲超宽带(Impulse Radio Ultra-Wideband,IR-UWB)所具有的高灵敏度和精细空间分辨率等优势,提出了一种基于双流融合网络的非接触式人体动作识别方法.该方法捕获目标运动所导致的时域信号变化,并通过对时域特征进行多普勒频移变化,提取到对应的频域特征.在此基础上,构建了一个融合多维卷积神经网络(Convolutional Neural Net-works,CNNs)和GoogLeNet模块的双流网络模型,以实现高精度的动作识别.通过广泛的实验测试,结果表明所提方法对8种常见人体动作的平均识别准确率达到94.89%,并且在不同的测试条件下均能保持超过90%的识别准确率,进一步验证了所提方法的鲁棒性.

    人机交互无线感知脉冲超宽带动作识别