首页期刊导航|计算机科学
期刊信息/Journal information
计算机科学
计算机科学

朱完元

月刊

1002-137X

jsjkx12@163.com

023-63500828

401121

重庆市渝北区洪湖西路18号

计算机科学/Journal Computer ScienceCSCD北大核心CSTPCD
查看更多>>本刊的读者对象是:大专院校师生,从事计算机科学与技术领域的科研、生产人员。办刊宗旨是:坚持“双百”方针,活跃计算机科学与技术领域的学术气氛,重点报导国内外计算机科学与技术的发展动态,为我国的计算机科学与技术立于世界之林、达到国际先进水平奋斗而矢志不渝。
正式出版
收录年代

    高性能并行计算的发展历程

    陈国良
    1-3页
    查看更多>>摘要:并行计算是相对于串行计算而言的,它是将一个计算任务分解成若干相对独立的子任务,然后用若干个处理器对其并行求解.使用并行计算最直接的目的就是提高问题的求解速度以快速完成原问题的解.非数值计算是相对数值计算而言的,它研究的是如何将计算科学中一些不能直接使用数学函数解决的问题并行求解.90年代开始,我带领团队系统地开展了此方面的研究,首先是奠定了所需的理论基础,并逐渐形成了完善的学科体系和应用示范.在此过程中,我们还积极倡导交叉学科研究,及时关注学科前沿技术,并且坚持学术研究要服务于国民经济主战场.在整个研究过程中,我们一方面积极开展国际学术交流,创办国际学术会议和专业期刊;另一方面坚持自力更生,研制自主可控的国产高性能计算机,创建科教平台为普及中国高性能计算机教育服务.

    并行计算高性能计算国产计算机学科体系

    跨域数据管理

    杜小勇李彤卢卫范举...
    4-12页
    查看更多>>摘要:随着数据成为新的生产要素和数字中国顶层战略的推进,跨域数据共享和流通对于实现数据要素价值最大化变得至关重要.国家通过布局全国一体化大数据中心体系、启动"东数西算"工程等一系列举措,为数据要素的跨域应用提供了基础设施.然而,传统的数据管理局限于单一域内,无法满足跨域场景下的数据管理需求.跨域数据管理面临通信层面的跨空间域挑战、数据建模层面的异构模型融合问题,以及数据访问层面的跨信任域挑战.从跨空间域、跨管辖域和跨信任域3个视角出发,探讨了跨域数据管理的内涵、研究挑战及关键技术,并展望了其未来发展趋势.

    数据管理跨空间域跨管辖域跨信任域

    跨模态目标重识别研究综述

    崔振宇周嘉欢彭宇新
    13-25页
    查看更多>>摘要:目标重识别(ReID)技术旨在匹配不同区域摄像头在不同时间拍摄到的同一目标,其核心是通过目标间的细粒度差异实现不同 目标的有效区分.因此,目标重识别技术被广泛应用于安防布控、刑侦监控等领域并发挥了重要作用.传统的目标重识别技术通常适用于光照条件良好情况下的可见光模态数据,但在处理黑夜低光照条件下的 目标重识别任务时,其性能通常受到严重限制.红外摄像机因其卓越的夜视性能,通常被应用于在低光照条件下采集目标红外图像.因此,跨模态目标重识别技术旨在通过可见光图像匹配红外图像,实现全天候不间断的目标重识别.近年来,跨模态目标重识别技术取得了很大进展,然而,对于现有模型的归纳总结及深入分析仍然欠缺.为此,对跨模态目标重识别领域的相关研究和新颖方法进行了深入调研和总结,讨论了现有方法在实际场景中面临的挑战,并从模型分类和模型评价两个方面对现有方法进行归纳与分析.首先,围绕跨模态目标重识别问题的研究难点,将跨模态目标重识别分为生成式方法和非生成式方法两大类;然后,对当前跨模态重识别领域中广泛使用的评测数据集以及相关评价指标进行了综述与总结;最后,讨论了跨模态重识别领域仍然存在的挑战并对未来发展趋势进行了展望.

    计算机视觉目标重识别跨模态细粒度特征表征学习

    数据科学的科学性与科学问题的分析

    朝乐门
    26-34页
    查看更多>>摘要:作为一门新兴的学科领域,数据科学的科学性受到了关注且其科学问题未明确提出.文中从科学研究范式及方法论、可证伪性和可再现性、科学精神及快速迭代以及科学研究纲领及理论体系4个方面探讨了数据科学的"科学性",并解答了为什么数据科学是一门新兴科学的问题.在此基础上,结合DIKW模型(DIKW Pyramid or Hierarchy)、DMP(Data-Model-Problem)模型、数据科学的统计学和机器学习方法论以及数据科学的流程与活动,提出了数据科学的7个核心科学问题:解释在先还是在后或无、问题对齐数据还是数据对齐问题、更加相信数据还是模型、更加重视性能还是可解释性、如何划分数据、如何用已知数据解决未知数据的问题、人在环路还是人出环路.最后,提出了数据科学研究的4点建议:聚焦数据科学本身的理论研究,推动数据的科学、技术和工程需要进一步分离和专业化,加强人工智能赋能的数据科学的理论与实践以及数据科学学科(Data Science as A Discipline)与学科中的数据科学(Data Science Within A Discipline)的联动.

    数据科学科学属性科学问题DIKW模型

    过滤器数据结构研究综述

    王瀚橙戴海鹏陈树森陈志鹏...
    35-40页
    查看更多>>摘要:过滤器数据结构可以近似地判断某个元素是否属于给定集合.典型的过滤器数据结构,如布隆过滤器、布谷鸟过滤器、商过滤器,以牺牲查询准确性为代价换取更低的内存空间消耗和查询时间开销.因此,得益于空间时间高效性,过滤器数据结构现已被广泛应用于计算机网络、物联网、数据库系统、文件系统、生物信息学、机器学习等领域的近似成员资格查询操作中.自20世纪70年代以来,过滤器数据结构受到了广泛的研究,在诸多领域取得了重要的进展,其研究思路也在不断变化.文中整理了近五十年来关于过滤器数据结构的经典研究成果,从过滤器数据结构的原理出发对已有工作进行分类总结,并比较不同工作之间的引证关系和改进思路,最后讨论了过滤器数据结构的未来研究方向.

    过滤器近似成员资格查询概率数据结构布隆过滤器布谷鸟过滤器商过滤器

    学习型过滤器综述

    李猛戴海鹏眭永熙顾荣...
    41-49页
    查看更多>>摘要:作为一种高效的概率性结构,过滤器可以高效地解决近似集合成员查询问题.近年来,随着机器学习技术的发展,一些学习型过滤器表现出色,超越了传统的过滤器.这些学习型过滤器考虑数据分布信息,将集合成员查询问题视为二分类问题,实现了超越传统过滤器的性能.受此启发,学习型过滤器研究领域迅速发展,出现了多个变种.然而,目前还缺乏对近些年相关工作的系统性回顾和比较.为了填补上述空缺,文中全面回顾了近年来的学习型过滤器相关工作,并展望了未来的发展方向.

    近似成员资格查询机器学习Bloom过滤器学习型过滤器假阳率

    面向国产深度学习平台的自然语言处理模型迁移研究

    葛慧斌王德鑫郑涛张婷...
    50-59页
    查看更多>>摘要:深度学习平台在新一代人工智能的发展中扮演着重要的角色.近年来,以昇腾平台为代表的国产人工智能软硬件系统快速发展,为国产深度学习平台的发展开辟出了新的道路.与此同时,为了发现并解决昇腾系统存在的潜在漏洞,昇腾平台积极开展常用深度学习模型的迁移工作.从自然语言处理算法角度切入,针对机器阅读理解、神经机器翻译、序列标注和文本分类四大自然语言处理任务,以昇腾平台的高性能硬件芯片为基础,探究迁移ALBERT,RNNSearch,BERT-CRF和TextING这4类典型的自然语言处理模型.基于以上迁移研究,发现和整理了昇腾平台架构设计在自然语言处理研究与业务上的主要不足,即计算图节点动态空间的分配特性、资源算子下沉设备侧、图算融合以及混合精度训练4个方面的问题,并为以上问题提出了相应的解决方案,并进行了实验验证.最后,为国产深度学习平台的发展提出未来优化的方向和相关建议.

    自然语言处理昇腾深度学习模型迁移平台构架

    无监督句对齐综述

    谷仕威刘静李丙春熊德意...
    60-67页
    查看更多>>摘要:无监督句对齐在自然语言处理领域是一个重要而具有挑战性的问题.该任务旨在找到不同语言中句子的对应关系,为跨语言信息检索、机器翻译等应用提供基础支持.该综述从方法、挑战和应用3个方面概括了无监督句对齐的研究现状.在方法方面,无监督句对齐涵盖了多种方法,包括基于多语言嵌入、聚类和自监督或者生成模型等.然而,无监督句对齐面临着多样性、语言差异和领域适应等挑战.语言的多义性和差异性使得句对齐变得复杂,尤其在低资源语言中更为明显.尽管面临挑战,无监督句对齐在跨语言信息检索、机器翻译、多语言信息聚合等领域具有重要应用.通过无监督句对齐,可以将不同语言中的信息整合,提升信息检索的效果.同时,该领域的研究也在不断推动技术的创新和发展,为实现更准确和稳健的无监督句对齐提供了契机.

    无监督句对齐自然语言处理机器翻译自监督低资源

    大语言模型安全现状与挑战

    赵月何锦雯朱申辰李聪仪...
    68-71页
    查看更多>>摘要:大语言模型因其出色的文本理解和生成能力,被广泛应用于自然语言处理领域并取得了显著成果,为社会各界带来了巨大的便利.然而,大语言模型自身仍存在明显的安全问题,严重影响其应用的可信性与可靠性,是安全学者需广泛关注的问题.文中针对大语言模型自身的安全问题,首先从基于大语言模型的恶意应用问题切入,阐述提示注入攻击及其相应的防御方法;其次,介绍大语言模型幻觉带来的可信问题,对幻觉问题的量化评估、幻觉来源和缓解技术是当前研究的重点;然后,大语言模型隐私安全问题强调了个人及企业数据的保护问题,一旦在进行人机交互时泄露商业秘密和个人敏感信息,将可能引发严重的安全风险,当前研究主要通过可信执行环境和隐私计算技术来进行风险规避;最后,提示泄露问题关注攻击者如何窃取有价值的提示词进行获利或通过个性化提示词泄露个人隐私.提升大语言模型的安全性需要综合考虑模型隐私保护、可解释性研究以及模型分布的稳定性与鲁棒性等问题.

    大语言模型人工智能安全恶意应用模型幻觉隐私安全提示泄露

    基于伪标签的无监督领域自适应行人重识别研究综述

    景叶怡然余增时云潇李天瑞...
    72-83页
    查看更多>>摘要:行人重识别是计算机视觉领域的热点研究课题之一.近年来,为了解决行人重识别实际应用中标签数据稀缺的问题,同时也为了有效地利用现有的标签数据,研究者们提出了基于生成对抗网络以及基于伪标签的领域自适应方法,用于进行跨领域的行人重识别研究.基于伪标签的无监督领域自适应行人重识别方法由于效果显著而备受研究者的青睐.文中梳理了近7年来基于伪标签的无监督领域自适应行人重识别的研究成果,将基于伪标签的方法从模型训练角度划分为两个阶段.1)伪标签生成阶段.现有工作的伪标签生成方法大多使用聚类方法,部分工作采用基于图结构学习的图匹配、图卷积网络方法来生成目标域的伪标签.2)伪标签精炼阶段.文中将现有的伪标签精炼方法归纳为基于表征学习的精炼方法以及基于相似度学习的精炼方法,并分别进行模型方法的总结与整理.最后,讨论现阶段基于伪标签的无监督领域自适应行人重识别面临的挑战并对未来可能的发展方向进行展望.

    行人重识别深度学习伪标签无监督领域自适应