首页期刊导航|软件学报
期刊信息/Journal information
软件学报
软件学报

李明树

月刊

1000-9825

jos@iscas.ac.cn

010-62562563

100190

北京8718信箱

软件学报/Journal Journal of SoftwareCSCD北大核心CSTPCDEI
查看更多>>《软件学报》是一本刊登计算机软件各领域原创性研究成果的期刊,所刊登的论文均经过严格的同行专家评议.《软件学报》主要面向全球华人计算机软件学者,致力于创办与世界计算机科学和软件技术发展同步的以中文为主的"中文国际软件学术期刊",为全球华人同行提供学术交流平台.
正式出版
收录年代

    预训练模型在软件工程领域应用研究进展

    宫丽娜周易人乔羽姜淑娟...
    1-26页
    查看更多>>摘要:近年来深度学习在软件工程领域任务中取得了优异的性能。众所周知,实际任务中优异性能依赖于大规模训练集,而收集和标记大规模训练集需要耗费大量资源和成本,这限制了深度学习技术在实际任务中的广泛应用。随着深度学习领域预训练模型(pre-trained model,PTM)的发布,将预训练模型引入到软件工程(software engineering,SE)任务中得到了国内外软件工程领域研究人员的广泛关注,并得到了质的飞跃,使得智能化软件工程进入了一个新时代。然而,目前没有研究提炼预训练模型在软件工程领域的成功和机遇。为阐明这一交叉领域的工作(pre-trained models for software engineering,PTM4SE),系统梳理当前基于预训练模型的智能软件工程相关工作,首先给出基于预训练模型的智能软件工程方法框架,其次分析讨论软件工程领域常用的预训练模型技术,详细介绍使用预训练模型的软件工程领域下游任务,并比较和分析预训练模型技术这些任务上的性能。然后详细介绍常用的训练和微调PTM的软件工程领域数据集。最后,讨论软件工程领域使用PTM面临的挑战和机遇。同时将整理的软件工程领域PTM和常用数据集发布在https://github。com/OpenSELab/PTM4SE。

    软件仓库挖掘预训练模型程序语言模型

    嵌入式系统的需求描述综述

    陈小红刘少彬金芝
    27-46页
    查看更多>>摘要:随着嵌入式系统的广泛应用,其需求正变得越来越复杂,需求分析成为嵌入式系统开发的关键阶段,如何准确地建模和描述需求成为首要问题。系统地调研嵌入式系统的需求描述,并进行全面的比较分析,以便更深入地理解嵌入式系统需求的核心关注点。首先采用系统化文献综述方法,对 1979 年 1 月-2023 年 11 月间发表的相关文献进行识别、筛选、汇总和分析。通过自动检索和滚雪球等检索过程,筛选出 150 篇与主题密切相关的文献,力求文献综述的全面性。其次,从需求描述关注点、需求描述维度、需求分析要素等方面,分析现有嵌入式需求描述语言的表达能力。最后,总结现有嵌入式系统软件需求描述所面临的挑战,并针对嵌入式软件智能合成任务,提出对嵌入式系统需求描述方法表达能力的要求。

    嵌入式系统需求描述需求描述语言需求分析系统需求

    服务器无感知计算系统性能优化技术研究综述

    杨光刘杰曲慕子王帅...
    47-78页
    查看更多>>摘要:服务器无感知计算是新兴的云计算模式,它基于"函数即服务(FaaS)"的范式,以函数为部署和调度的基本单位,为用户提供大规模并行和自动伸缩的函数执行服务,且无需用户管理底层资源。对于用户,服务器无感知计算能够帮助他们摆脱集群底层基础设施管理的负担,专注于业务层的开发和创新;对于服务提供商,服务器无感知计算将应用分解为细粒度的函数,极大地提高了调度效率和资源利用率。显著的优势让服务器无感知计算迅速吸引了业界的注意,然而,服务器无感知计算与传统云计算迥然不同的计算模式以及对任务各方面的严格限制给应用的迁移带来了诸多障碍,各种越来越复杂的任务也对服务器无感知计算的性能提出了越来越高的要求,服务器无感知计算的性能优化成为一个重要的研究课题。从 4 个方面对服务器无感知计算系统性能优化技术的相关研究工作进行梳理和综述,并介绍现有的系统实现。(1)介绍面向典型任务的优化技术,包括任务适配和针对特定任务的系统优化;(2)综述沙箱环境的优化工作,包括沙箱方案和冷启动优化技术,它们是决定函数运行速度的核心;(3)概括I/O和通信技术的优化,它们是服务器无感知计算应用程序的主要性能瓶颈;(4)简述相关的资源调度技术,包括面向平台和面向用户的调度策略,它们决定着系统的资源利用率和任务的执行效率。最后,总结当前服务器无感知计算性能优化技术所面临的问题和挑战,并展望未来可能的发展方向。

    服务器无感知计算函数即服务云函数云计算性能优化

    面向大规模图像检索的哈希学习综述

    张雪凝刘兴波宋井宽聂秀山...
    79-106页
    查看更多>>摘要:随着互联网空间中图像数据的爆发式增长和图像应用领域的拓宽,大规模图像检索的需求与日俱增。哈希学习为大规模图像检索提供显著的存储与检索效率,并成为近年来一个研究热点。现有哈希学习综述存在着时效性弱与技术路线不清晰的问题,即多总结 5-10 年前的研究成果,且较少总结哈希学习算法各组成部分间的关联关系。鉴于此,通过总结近 20 年公开发表的哈希学习文献,对面向大规模图像检索的哈希学习进行系统的综述性研究。首先,介绍哈希学习的技术路线和哈希学习算法的主要组成部分,包括损失函数、优化策略及样本外扩展映射。其次,将面向图像检索的哈希学习算法分为无监督哈希方法和监督哈希方法两类,并分别梳理每类方法的研究现状和演化过程。然后,介绍哈希学习算法评估通用的图像数据集与评估指标,并通过对比实验分析部分经典算法的性能。最后,结合哈希学习的局限性与新挑战对其发展前景进行阶段性总结与展望。

    图像检索大规模数据近似最近邻检索哈希学习相似性保持

    混合博弈问题的求解与应用综述

    董绍康李超杨光葛振兴...
    107-151页
    查看更多>>摘要:近年来,随着人工智能技术在序贯决策和博弈对抗等问题的应用方面取得了飞速发展,围棋、游戏、德扑和麻将等领域取得了巨大的进步,例如,AlphaGo、OpenAI Five、AlphaStar、DeepStack、Libratus、Pluribus和Suphx等系统都在这些领域中达到或超过人类专家水平。这些应用集中在双人、两队或者多人的零和博弈问题中,而对于混合博弈问题的研究缺乏实质性的进展与突破。区别于零和博弈,混合博弈需要综合考虑个体收益、集体收益和均衡收益等诸多目标,被广泛应用于公共资源分配、任务调度和自动驾驶等现实场景。因此,对于混合博弈问题的研究至关重要。通过梳理当前混合博弈领域中的重要概念和相关工作,深入分析国内外研究现状和未来发展方向。具体地,首先介绍混合博弈问题的定义与分类;其次详细阐述博弈解概念和求解目标,包含纳什均衡、相关均衡、帕累托最优等解概念,最大化个体收益、最大化集体收益以及兼顾公平等求解目标;接下来根据不同的求解目标,分别对博弈论方法、强化学习方法以及这两种方法的结合进行详细探讨和分析;最后介绍相关的应用场景和实验仿真环境,并对未来研究的方向进行总结与展望。

    混合博弈博弈论强化学习

    文档级神经机器翻译综述

    吕星林李军辉陶仕敏杨浩...
    152-183页
    查看更多>>摘要:机器翻译(machine translation,MT)研究旨在构建一个自动转换系统,将给定源语言序列自动地转换为具有相同语义的目标语言序列。由于机器翻译广阔的应用场景,使其成为自然语言理解领域乃至人工智能领域的一个重要的研究方向。近年来,端到端的神经机器翻译(neural machine translation,NMT)方法显著超越了统计机器翻译(statistical machine translation,SMT)方法,成为目前机器翻译研究的主流方法。然而,神经机器翻译系统通常以句子为翻译单位,在面向文档的翻译场景中,将文档中每个句子独立地进行翻译,会因脱离文档的篇章语境引起一些篇章级的错误,如词语错翻、句子间不连贯等。因此将文档级的信息融入到翻译的过程中去解决跨句的篇章级错误是更加自然和合理的做法,文档级的神经机器翻译(document-level neural machine translation,DNMT)的目标正是如此,成为机器翻译研究的热门方向。调研了近年来在文档级神经机器翻译研究方向的主要工作,从篇章评测方法、使用的数据集和模型方法等方面系统地对当前研究工作进行了归纳与阐述,目的是帮助研究者们快速了解文档级神经机器翻译研究现状以及未来的发展和研究方向。同时在文中也阐述了在文档级神经机器翻译的一些展望、困难和挑战,希望能带给研究者们一些启发。

    神经机器翻译Transformer模型文档上下文篇章评测

    无线时间敏感网络技术综述

    乔萱李宗辉刘强艾渤...
    184-202页
    查看更多>>摘要:由IEEE 802。1 任务组开发的时间敏感网络标准可以用来构建高可靠、低延迟、低抖动的以太网,将时间敏感网络扩展到无线领域也是目前许多工作的研究重点。与传统的有线通信相比,无线的时间敏感网络不仅可以实现高可靠和低时延通信,还具有更高的灵活性、更强的移动性以及更低的布线和维护成本等优点。因此,在面对未来无人驾驶、协作机器人、远程医疗控制等新兴应用时,无线时间敏感网络被认为是一种十分有前景的技术。无线网络一般可以分为基于基础设施的无线网络和无基础设施的无线网络,而后者基于移动性还可以分为两类:移动自组织网络和无线传感网络,因此主要从这 3 种网络类型出发,对其应用场景、相关技术、路由协议以及高可靠低时延传输进行了调研与综述。

    时间敏感网络5G移动自组织网络无线传感网络

    面向APT攻击的溯源和推理研究综述

    杨秀璋彭国军刘思德田杨...
    203-252页
    查看更多>>摘要:高级可持续性威胁(advanced persistent threat,APT)是一种新型网络攻击,具有极强的组织性、隐蔽性、持续性、对抗性和破坏性,给全球网络安全带来严重危害。传统APT攻击防御倾向于构建模型检测攻击的恶意性或识别家族类别,以被动防御为主,缺乏全面及深入地梳理APT攻击溯源和推理领域的工作。基于此,围绕APT攻击的溯源和推理的智能化方法开展综述性研究。首先,提出APT攻击防御链,有效地将APT攻击检测、溯源和推理进行区分和关联;其次,详细比较APT攻击检测 4 个任务的相关工作;然后,系统总结面向区域、组织、攻击者、地址和攻击模型的APT攻击溯源工作;再次,将APT攻击推理划分为攻击意图推理、攻击路径感知、攻击场景还原、攻击阻断和反制这4个方面,对相关研究进行详细总结和对比;最后,讨论APT攻击防御领域的热点主题、发展趋势和挑战。

    高级可持续威胁网络安全攻击溯源攻击推理人工智能

    Tor被动流量分析综述

    梅汉涛程光朱怡霖周余阳...
    253-288页
    查看更多>>摘要:随着网络的蓬勃发展,用户隐私正面临着前所未有的挑战。人们开发出多种匿名通信系统来保护隐私,第2 代洋葱路由Tor(the second-generation onion router)是目前最为广泛使用的匿名通信系统。然而,卓越的匿名性也使之成为不法分子犯罪的温床,如今Tor中充斥着非法交易、网络犯罪等。Tor被动流量分析通过被动观察网络流量对Tor进行去匿名化,已成为最热门的去匿名化技术。从Tor与流量分析基本概念出发,介绍Tor被动流量分析技术的应用场景与威胁模型。按照技术类型将现有工作分为流量分类技术与流关联技术,依据分析流程分别对比其流量采集方法、特征提取方法、使用算法。最后探讨当前研究面临的主要挑战与未来可能的研究趋势。

    Tor流量分析流量分类网站指纹流关联

    多路径传输技术研究综述

    苏金树宋丛溪计晓岚徐草...
    289-320页
    查看更多>>摘要:多路径传输技术是指通过设备上的多个网络接口,在通信双方建立多条传输路径,实现带宽聚合、负载均衡、路径冗余,增加传输的吞吐量,提高可靠性。多路径传输技术凭借其上述优势,已被广泛应用于服务器、终端和数据中心等场景,是网络体系结构和传输技术研究的重要组成,具有重要研究价值和意义。为此,从概念、核心机制等方面,系统梳理了多路径传输技术。首先概述了多路径传输的基本概念、标准化进程以及应用价值。其次,阐述多路径传输技术的核心机制,包括拥塞控制、报文调度、路径管理、重传机制、安全机制,以及面向特定应用的机制设计。对每种机制的分类方法、主要研究成果给予了总结和评述,分析总结了不同机制的优缺点与发展方向。最后,探讨了多路径传输技术研究面临的挑战,展望了未来研究方向。

    多路径传输QUIC拥塞控制报文调度智能网络