首页期刊导航|计算机科学
期刊信息/Journal information
计算机科学
计算机科学

朱完元

月刊

1002-137X

jsjkx12@163.com

023-63500828

401121

重庆市渝北区洪湖西路18号

计算机科学/Journal Computer ScienceCSCD北大核心CSTPCD
查看更多>>本刊的读者对象是:大专院校师生,从事计算机科学与技术领域的科研、生产人员。办刊宗旨是:坚持“双百”方针,活跃计算机科学与技术领域的学术气氛,重点报导国内外计算机科学与技术的发展动态,为我国的计算机科学与技术立于世界之林、达到国际先进水平奋斗而矢志不渝。
正式出版
收录年代

    驶向智能未来:深度学习在轨道交通革新中的应用

    孙宇墨李昕航赵文杰朱力...
    1-10页
    查看更多>>摘要:目前,轨道交通凭借其便利性、高效性等特点,在城市交通中扮演着重要角色.然而,现有轨道交通系统的运行过程也存在着复杂的问题,客流预测、列车调度等环节仍采用人工方式,效率和准确率均较低,对系统性能造成了一定影响.近年来,深度学习蓬勃发展,其强大的特征提取与图像识别能力,也为轨道交通的自动化、智能化发展提供了更多的可能性.文中首先阐述了当前轨道交通在现实生活各种应用场景中面临的挑战;其次从轨道交通感知任务、预测任务、优化任务等方面分析了深度学习赋能轨道交通领域的主要应用;最后,从高精度和高鲁棒性的安全性检测,轻量级的轨道交通模型,全自动的轨道交通智能化运行,以及借助云计算、大数据的信息处理高效化4个方面展望了未来深度学习在轨道交通中的发展方向.

    深度学习轨道交通感知预测优化

    构音障碍说话人自适应研究进展及展望

    康新晨董雪燕姚登峰钟经华...
    11-19页
    查看更多>>摘要:自动化语音识别工具让构音障碍者和正常人的沟通变得顺畅,因此,近年来构音障碍语音识别成为了一项热门研究.构音障碍语音识别的研究包括:收集构音障碍者和正常人的发音数据,对构音障碍者和正常人的语音进行声学特征表示,利用机器学习模型比较和识别发音的内容并定位出差异性,以帮助构音障碍者改善发音.然而,由于收集构音障碍者的大量语音数据非常困难,且构音障碍者存在发音的强变异性,导致通用语音识别模型的效果往往不佳.为了解决这一问题,许多研究提出将说话人自适应方法引入构音障碍语音识别.对大量相关文献进行调研发现,当前此类研究主要围绕特征域和模型域对构音障碍语音进行分析.文中重点分析特征变换和辅助特征如何解决语音特征的差异性表示,以及声学模型的线性变换、微调声学模型参数和基于数据选择的域自适应方法如何提高模型识别的准确率.最后总结出构音障碍说话人自适应研究当前遇到的问题,并指出未来的研究可以从语音变异性的分析、多特征多模态数据的融合以及基于小数量的自适应方法的角度,提升构音障碍语音识别模型的有效性.

    构音障碍说话人自适应辅助特征变换微调域自适应

    离群点检测算法综述

    孔翎超刘国柱
    20-33页
    查看更多>>摘要:离群点检测作为数据挖掘领域的一个重要研究方向,其目的是发掘隐藏在数据集合中与众不同且具有潜在分析价值的数据,辅助研究人员甄别数据源可能存在的问题.目前,离群点检测已被广泛应用于欺诈识别、智慧医疗、入侵检测、故障诊断等诸多领域.文中在总结前人经验的基础上,首先讨论离群点的定义、产生原因以及典型应用领域,综述了 DBSCAN和LOF等离群点检测经典算法及其改进算法的优势和局限,分析了深度学习方法在离群点检测领域的优势;其次结合当前互联网背景下海量、高维、时序数据处理需求,对离群点检测算法在新环境下的发展状况做进一步研究;最后介绍离群点检测算法的评价指标、代价因子在离群点检测评价中的作用以及常用工具包和数据集,总结展望了离群点检测面临的挑战和未来的发展方向.

    离群点异常检测深度学习时序数据数据挖掘

    卡-梅框架下数据财产权益保护规则分类分级配置研究

    丛颖男彭友朱金清
    34-44页
    查看更多>>摘要:在社会、经济数字化转型的关键时期,建立高效的数据要素市场是数字经济持续快速发展的重要基础和基本前提,也是多学科交融的时代课题.数据的财产权益保护制度是数据要素市场的基础制度,目前相关的理论探讨可谓百家争鸣,与法律规定和裁判观点共同构成了一张"规则清单".卡-梅框架提供了一种以经济效率为标准的规则选择方法,与建设高效的数据要素市场这一政策目标相契合.在此框架下,从事前效率和事后效率两个视角分别对个人数据、企业数据和公共数据的财产权益保护规则进行比较和选择,发现对于个人数据和企业数据而言,提供事后救济的责任规则相比赋予绝对化财产权的财产规则更具效率;而对于公共数据而言,两者各有优势.基于此,进一步对个人数据保护提出了构建"三层构造"保护模式的立法建议和建立数据匿名化制度的构想,对企业数据保护提出了构建非绝对性财产权利的方向指引,对公共数据提出了建立三类规则相互配合的分类分级开放格局的建议.

    数据确权卡-梅框架数据要素市场规则的效率选择个人数据企业数据公共数据

    面向延迟标签场景下的可解释信用评估模型

    辛博丁志军
    45-55页
    查看更多>>摘要:随着社会经济的快速发展,信贷业务在金融领域中扮演着越来越重要的角色,利用机器学习算法进行信用评估成为了当前主流的方法.然而,目前仍存在一些问题亟待解决,如延迟标签带来的有标签数据不充分、模型滞后性的问题,以及动态信用评估模型缺乏可解释性的问题.针对这些问题,提出了一种面向延迟标签场景的可解释信用评估模型.该模型在动态模型树的基础上进行了加权改进,结合了延迟标签更新算法和自适应阈值的伪标签选择策略,将延迟标签数据看作反馈数据和伪标签数据两种状态分别进行处理,平衡了有标签数据不充分和模型滞后带来的影响,并实现了模型的可解释性.最后,在一些合成和真实的信用评估数据集上对模型进行了实验,与其他主流的算法相比,其更好地权衡了预测性能和可解释性.

    信用评估延迟标签可解释性动态模型树伪标签选择

    面向幂律图的动态图存储结构Power-PCSR

    毛志雄刘志楠高叙宁王蒙湘...
    56-62页
    查看更多>>摘要:图数据在现实生活中广泛存在,且不断发生变化.传统高效的静态图存储方式——压缩行/列(Compressed Sparse Row/Column,CSR/CSR)存储方式在更新图数据时需要大量的数据迁移,不适用于动态图数据.而能够高效更新图数据的邻接表(Adjacency List,AL)存储方式往往带有大量的指针,导致其图数据读取和分析效率低.Packed Compressed Sparse Row(PCSR)是一种基于CSR的动态图存储结构.该结构在存储边数据时并不是采用连续无空隙数组,而是采用留有空槽的压缩存储阵列(Packed Memory Arrays,PM A)结构,便于边数据的插入.因此,PCSR支持高效图更新和图分析.但是,PCSR在存储幂律图时,其性能容易受大度数顶点的影响.为此,基于PCSR提出一种支持可高效更新和分析动态幂律图的图存储结构Power-PCSR.该结构将幂律图中度数较大的顶点单独存储在一个独立的PMA中,其他所有小度数顶点与PCSR 一样存储在原PMA中.小度顶点变化导致的数据迁移不会触及大度数顶点,从而大大减少了数据迁移数量;同样,大度数顶点更新导致的数据迁移只限制在每个大度数顶点的PMA内部,不会涉及小度数顶点和其他大度数顶点的数据迁移.实验显示,Power-PCSR 在分析图数据时与PCSR具有相似的性能,而在更新图数据时比PCSR快2倍.

    动态图存储动态图更新数据迁移Power-PCSR幂律图

    融合AP聚类算法和宽度学习系统的分布外硬盘故障预测

    王屹阳刘发贵彭玲霞钟国祥...
    63-74页
    查看更多>>摘要:硬盘是云数据中心最主要的存储设备,硬盘故障预测是保障数据安全的重要手段.但是,硬盘的故障与健康样本之间存在着极端的数量不平衡问题,这会导致模型偏差;此外,不同型号的硬盘数据分布存在一定的差异,在特定硬盘数据上训练的模型往往不适用于其他硬盘.对于这两个问题,文中提出了一种融合AP聚类算法和宽度学习系统的分布外硬盘故障预测方法.针对样本不平衡问题,文中使用AP聚类算法对硬盘故障出现前一阶段的样本集进行聚类,将与故障样本处于同一聚类簇的样本扩充为故障样本.针对不同型号硬盘分布存在差异的问题,文中结合流形正则化框架和宽度学习系统来学习硬盘数据的低维结构,提高模型对未知分布数据的泛化能力.实验结果表明,在AP聚类算法重采样的样本集上,相较于用于对比的重采样方法得到的样本集,多种故障预测方法的F1_Score取得了平均0.2的提升.此外,在分布外硬盘故障预测任务上,所提模型的F1_Score相比对比方法提升了 0.1~0.2.

    硬盘故障预测类不平衡分布外泛化AP聚类宽度学习系统流形学习

    基于逻辑视角的不完备形式背景上知识相容表示与推理

    张少霞李德玉翟岩慧
    75-82页
    查看更多>>摘要:形式背景中的信息不完备引起了知识的不相容性,即蕴涵在不完备形式背景的任一完备化形式背景不能同时成立.逻辑描述是从语义上进行知识表示、语构上制定语义协调推理规则的方法论.首先,从逻辑角度研究不完备数据上的知识相容语义表示,通过定义不完备实例刻画知识的合理性和相容性,并构造最紧致的相容集(相容规范基).其次,语构上制定具有语义合理性、相容性和完备性的推理规则,从而避免知识推理过程中产生不相容知识和无效知识.最后,将逻辑研究结果运用在不完备形式背景上,引入两类蕴涵形式:↓↓-型蕴涵和↑ ↑-型蕴涵.这两类蕴涵兼具相容性且相对于可接受性蕴涵尺度更加严格,构造这两类蕴涵的相容规范基并验证其完备性和无冗余性.

    不完备形式背景知识相容性知识表示相容规范基知识推理

    基于θ算子的多粒度直觉模糊粗糙集模型

    郑宇薛占熬吕明明徐久成...
    83-96页
    查看更多>>摘要:针对在多属性决策中决策者难以在多个属性相互冲突时做出准确判断的问题,文中在直觉模糊近似空间中,首先利用直觉模糊集的隶属度、非隶属度与模糊蕴含算子,提出了基于θ算子和θ*算子的直觉模糊集及其隶属度和非隶属度的概念,并证明了它们的一系列性质.然后,在直觉模糊集与多粒度粗糙集上,定义基于θ算子的多粒度直觉模糊粗糙集的悲观、乐观模型,讨论两种模型的相关性质.最后,给出了基于θ算子的多粒度直觉模糊粗糙集模型的多属性决策算法,将高校引进的人才评价和企业绿色经济供应链的商家评价作为实例进行了分析,同时还与已有方法进行了分析对比,用乐观、悲观模型与已有方法的决策结果的对比证明了所提方法的正确性,并验证了该模型算法的有效性.

    粗糙集直觉模糊集蕴含算子多粒度多属性决策

    基于共享最近邻的自适应密度峰值聚类算法

    王心耕杜韬周劲陈迪...
    97-105页
    查看更多>>摘要:密度峰值聚类算法(DPC)是一种简单高效的无监督聚类算法,该算法虽能自动发现簇中心,实现任意形状数据的高效聚类,但依然存在一些缺陷.针对密度峰值聚类算法在定义相关度量值时未考虑数据的位置信息、聚类中心数目需要人工预先设定且分配样本点时易出现连锁反应这3个缺陷,提出一种基于共享最近邻的自适应密度峰值聚类算法.首先,利用共享最近邻重新定义局部密度等度量值,充分考虑了数据分布的局部特点,使样本点的空间分布特征得以更好地体现;其次,通过引入密度衰减现象让样本点自动聚集成微簇,实现了簇个数自适应确定和簇中心自适应选取;最后,提出一种两阶段的分配方法,先将微簇合并形成簇的主干部分,再用上一步分配好的簇主干指导剩余点的分配,避免了链式反应的发生.在二维合成数据集以及UCI数据集上的实现表明,相较于经典的密度峰值聚类算法及近年来对其提出的改进算法,在大多数情况下,所提算法表现出更优异的性能.

    共享最近邻密度峰值聚类分配策略聚类中心密度衰减