首页期刊导航|计算机科学
期刊信息/Journal information
计算机科学
计算机科学

朱完元

月刊

1002-137X

jsjkx12@163.com

023-63500828

401121

重庆市渝北区洪湖西路18号

计算机科学/Journal Computer ScienceCSCD北大核心CSTPCD
查看更多>>本刊的读者对象是:大专院校师生,从事计算机科学与技术领域的科研、生产人员。办刊宗旨是:坚持“双百”方针,活跃计算机科学与技术领域的学术气氛,重点报导国内外计算机科学与技术的发展动态,为我国的计算机科学与技术立于世界之林、达到国际先进水平奋斗而矢志不渝。
正式出版
收录年代

    一种基于集成学习的开源许可证检测与兼容性判断的方法

    白江浩朴勇
    79-86页
    查看更多>>摘要:软件供应链的安全性和可靠性对软件质量和演化有重要影响,而软件组件的许可证分析正是软件供应链中不可或缺的一环.开源许可证约束着开源软件的使用条件,以保护知识产权并维持开源软件的长远发展.为了避免法律风险与财产损失,识别开源软件许可证并判断开源许可证之间的兼容性至关重要.文中提出了基于集成学习的开源许可证的检测方法与依据兼容性的许可证推荐方法.具体来讲,提出了以基于大语言模型的集成学习为主,以规则匹配为辅的方法来进行开源许可证检测,并依据需求与有向图算法来完成许可证的兼容性判断与推荐.实验表明,相比于传统方法,该方法在更少的维护成本与高扩展性的优势下具有更好的检测效果,也能够有效地检测出兼容性并推荐结果.

    大语言模型集成学习开源许可证句向量相似度兼容性判断

    开源软件开发者价值评估体系及其实证研究

    游兰田明炎周烨陈智军...
    87-99页
    查看更多>>摘要:如何科学客观地评估开源软件开发者的价值是开源领域面临的一个重要问题.现有研究方法存在评估指标较单一、指标权重难以确定等问题.针对这些问题,依据开源生态大数据分析,结合主客观评估方法,提出了一种多维度、多层次的开源软件开发者价值评估体系.综合考虑开发者在项目管理、编程、团队协作、学习、敬业度等方面的表现,通过5个一级指标、12个二级指标和7个三级指标,较全面和客观地评估开源软件开发者的能力和价值.采用Critic方法确定各维度指标的权重,解决了经验权重导致的准确性不高的问题.最后,采用Github 2020年全域开源生态数据,展开了多组实证研究,验证了开源社区开发者价值评估体系的有效性和可行性,为开源软件人才的培养、发现和管理提供了一种客观、科学且操作性较强的衡量方法.实验代码可从Github平台获取1).

    开源软件开发者价值评估指标体系指标权重实证研究分析

    基于数据局部性的循环分块选择算法

    廖启华聂凯韩林陈梦尧...
    100-109页
    查看更多>>摘要:现有的多面体编译框架(如Pluto,LLVM/Polly和GCC/Graphite)在进行循环分块时,都采用了固定分块大小,无法充分发挥不同硬件的缓存特性,导致存在较大的性能差异.针对这一问题,涌现了许多基于多级缓存和数据局部性的循环分块算法,但这些算法往往只能优化特定循环程序或者缺乏综合考虑,不适合移植到通用编译器中.文中提出了一种基于数据局部性的循环分块选择算法,该算法不仅考虑了缓存替换策略的影响,还考虑了多核环境下的负载均衡问题.算法基于LLVM中的Polly模块实现,并选用Pluto和PolyBench中的部分测试用例进行单核和多核测试.实验结果表明,单核环境下,相比LLVM/Polly的默认分块方法,该算法在两种硬件平台下分别获得了平均2.03和2.05的加速比,且在多核环境下具有良好的并行可扩展性.

    数据局部性多面体模型循环分块分块大小负载均衡

    基于多面体模型的矩阵乘法自动混合精度优化

    何昊天周蓓郭绍忠张作言...
    110-119页
    查看更多>>摘要:混合精度是计算机中的一种数值计算技术,通过将计算中的部分数据类型从高精度转换成低精度来提高计算效率.矩阵乘法在计算机科学和数学中有着重要而广泛的应用,在矩阵乘法中使用混合精度技术来加速计算过程是一项很有挑战性的工作.现有的混合精度优化存在一些问题,例如存储开销大,必须在特定的硬件单元上实现,限制了模型或算法的部署选项并降低了其可移植性.针对上述问题,提出并实现了基于多面体模型的混合精度代码自动生成工具AGMMMPC.通过将低精度乘高精度加基础混合精度矩阵乘代码生成功能添加到"源-源"的PPCG编译器中,并使用精度调优算法(Precision Tuning,PT)找到基础混合精度计算中的高频误差点,将这些点用高精度计算,其余点用基础混合精度计算,有效减小基础混合精度计算中的误差,首次实现了源到源的面向矩阵乘计算的混合精度代码自动生成.实验表明,以高精度计算为基准,AGMMMPC生成的高级混合精度代码在X86平台上的最大加速比为1.39,几何平均加速比为1.14.

    混合精度矩阵乘法多面体模型调度变换代码生成

    基于混合并行的分布式训练优化研究

    徐金龙李鹏飞李嘉楠陈飙元...
    120-128页
    查看更多>>摘要:大型神经网络训练是深度学习领域的一个热点话题,而分布式训练是基于多节点实现大型神经网络训练的最佳方法之一.分布式训练通常包含数据并行、层间并行和层内并行3种并行方法.然而现有的框架在层间并行时只能对模型进行手动切分,增加了模型设计的抽象复杂度,对此提出了节点约束关系搜索算法,实现了模型的自动切分.另外,在传统的数据并行和层间并行中,由于模型的复杂约束关系和通信操作的需要,计算和通信往往受到严格的序列化限制,为此引入了同步优化算法,实现了计算和通信的重叠,有效提高了整体训练的效率.实验对不同规模的GPT-2,AlexNet,VGG16和ResNet50模型进行训练,使用同步优化算法在6节点条件下可以将GPT2-XL,GPT2-LARGE和GPT2-MEDIUM模型的训练性能分别提升1.14倍、1.18倍和1.23倍,在1节点条件下将AlexNet,VGG16和ResNet50模型的训练性能分别提升1.31倍、1.14倍和1.03倍.实验结果表明,同步优化算法能够提升混合并行中的训练效率.

    分布式训练混合并行自动切分通信优化梯度同步

    一种面向通用计算设备的自动流水线并行训练框架

    钟震宇林勇良王昊天李东闻...
    129-136页
    查看更多>>摘要:训练大规模神经网络通常会出现单个计算节点的内存和计算能力不足的情况,需要通过多个节点分布式训练来实现.现有的分布式深度学习框架主要针对特定的硬件环境设计,不能够有效适应各类通用计算设备.为支持大规模深度神经网络的高效训练,实现了一种通用的自动流水线并行分布式训练框架.本框架通过结合基于流水线并行的模型并行策略与神经网络模型自动拆分算法,实现了在包括国内新一代超级计算机在内的通用计算机集群上,对大规模神经网络模型与训练数据进行自动并行化处理和训练,显著减轻单个计算节点的内存和计算压力.该框架无需人工调整,可以自动高效地在多节点分布式环境中部署深度神经网络,不仅适用于超级计算机等高性能计算机集群,还可以部署到其他通用的分布式计算环境中,为大规模神经网络的自动化分布式训练提供支持.

    流水线并行深度神经网络超级计算机MPI并行计算

    新一代神威处理器上高效任务流并行系统

    傅游杜雷明高希然陈莉...
    137-146页
    查看更多>>摘要:我国自主研制的新一代神威超级计算机相比前一代的神威太湖之光,具有更强大的内存系统和更高的计算密度,其主力编程模型仍然是块同步(Bulk Synchronous Parallelism,BSP)模型.顺序任务流(Sequential Task Flow,STF)模型基于数据流信息实现对串行程序的自动任务并行,并通过任务间的细粒度同步实现异步并行,相比于BSP模型的全局同步,并行度更高,负载更均衡.STF模型为用户高效使用神威平台提供了一种新选择.但在众核系统上,STF模型的运行时开销会直接影响并行程序性能.首先,分析新一代神威处理器影响STF模型高效实现的两个特征;然后,利用处理器架构的独有特性,提出一种基于代理的数据流构图机制以实现模型的构图需求,以及一种无锁的集中式任务调度机制以优化调度开销.最后,基于以上技术,为AceMesh模型实现了高效的任务流并行系统.实验表明,实现的任务流并行系统相比传统运行时支持优势显著,在细粒度任务场景下最高加速2.37倍;AceMesh性能高于神威平台的OpenACC模型,对典型应用的加速最高达到2.07倍.

    顺序任务流模型异构众核并行任务调度数据流并行块同步模型

    基于v-Informer的云平台资源负载预测方法

    尤文龙邓莉李锐龙谢雨欣...
    147-156页
    查看更多>>摘要:目前,云计算技术的使用非常广泛.随着用户量的增加,云计算资源的分配管理也越来越重要,而准确的负载预测是分配管理的重要依据.但由于云平台任务有多个负载特征,且特征的相关性变化趋势各不相同,因此难以从长期的历史数据中提取出有效的依赖信息.在Informer模型的基础上,提出了一种针对高动态云平台任务CPU长期负载预测方法v-Informer,该方法通过变分模态分解来分解负载序列中的变化趋势,引入多头自注意力机制捕获其中的长期依赖性和局部非线性关系,同时应用梯度集中技术改进优化器,减少计算开销.分别在微软云平台和谷歌云平台数据上进行实验,结果表明,与目前已有的CPU负载预测模型LSTM,Transformer,TCN和CEEMDAN-Informer相比,v-Informer在Google数据集上的预测误差分别减少了 34%,19%,15%和6.5%;在微软数据集上的预测误差分别减少了 32%,16%,12%和7%,具有较好的预测精度.

    云平台CPU负载多步预测模态分解Informer梯度收敛

    基于时空图注意力卷积神经网络的车辆轨迹预测

    袁静夏英
    157-165页
    查看更多>>摘要:车辆轨迹预测是交通管理、智能汽车和自动驾驶等领域的一项关键技术.准确预测车辆轨迹,有利于汽车安全行驶.城市交通场景中,车辆轨迹数据的时空特征复杂多变.为充分获取数据中的动态时空相关性,提高轨迹预测精度,同时降低模型复杂度,提出了时空图注意力卷积神经网络模型(Spatial-Temporal Graph Attention Convolutional Network,STGACN).该模型首先通过轨迹信息嵌入模块对车辆历史轨迹数据进行时空图转换,然后通过时空卷积块及其堆叠完成轨迹数据的时序特征和空间特征的提取与融合,最终由门控递归单元完成编码与解码工作,得到预测轨迹.模型采用由膨胀因果卷积和门控单元组成的门控卷积网络提取时序特征,避免了循环神经网络带来的冗余迭代,使得模型参数更少,轨迹预测推理速度更快;时空卷积块组的时空特征融合工作使模型关注到更丰富的场景特征,提高了预测精度.在真实轨迹数据集Argoverse和NGSIM上进行实验,结果表明STGACN模型与基线模型相比,具有更高的预测精度和效率.

    车辆轨迹预测时空相关性时空图图卷积网络注意力机制

    申报提醒|CCF产学合作基金

    CCF微信公众号
    165页