首页期刊导航|计算机科学
期刊信息/Journal information
计算机科学
计算机科学

朱完元

月刊

1002-137X

jsjkx12@163.com

023-63500828

401121

重庆市渝北区洪湖西路18号

计算机科学/Journal Computer ScienceCSCD北大核心CSTPCD
查看更多>>本刊的读者对象是:大专院校师生,从事计算机科学与技术领域的科研、生产人员。办刊宗旨是:坚持“双百”方针,活跃计算机科学与技术领域的学术气氛,重点报导国内外计算机科学与技术的发展动态,为我国的计算机科学与技术立于世界之林、达到国际先进水平奋斗而矢志不渝。
正式出版
收录年代

    基于关系图谱的科技数据分析算法

    张寒烁杨冬菊
    174-179页
    查看更多>>摘要:随着科技数据量的不断增长,各科技部门积累了大量科技项目的科技管理数据.对于大量结构化数据,需要针对分散数据进行整理、分析,最终按需求提供数据查询与抽取服务.由于在关系数据库中关联关系的分析效果不佳,为了提高分析效率,文中引入了关系图谱进行数据处理.首先,提出了一种基于词频的实体搜索与定位算法来提取实体和关系,并构建关系图谱;其次,对关系图谱进行分析,提出了一种基于改进FP-growth的图数据频繁项挖掘算法;然后,设计了基于图数据的数据筛选流程,进行数据的筛选、分析,并定义评分矩阵,对待筛选数据情况进行评价,最终给出分析意见,且数据筛选的评价标准可以进行自定义;最后,结合构建的关系图谱,将算法进行了实际应用,并将其封装为服务.实验结果表明,提出的基于改进FP-growth的频繁项挖掘算法相比传统FP-growth算法在时间上有10%~12%的提升,数据筛选过程的准确率达到97%左右.

    关系图谱数据分析图谱构建人员关系图谱数据挖掘服务应用

    无模型强化学习研究综述

    秦智慧李宁刘晓彤刘秀磊...
    180-187页
    查看更多>>摘要:强化学习(Reinforcement Learning,RL)作为机器学习领域中与监督学习、无监督学习并列的第三种学习范式,通过与环境进行交互来学习,最终将累积收益最大化.常用的强化学习算法分为模型化强化学习(Model-based Reinforcement Lear-ning)和无模型强化学习(Model-free Reinforcement Learning).模型化强化学习需要根据真实环境的状态转移数据来预定义环境动态模型,随后在通过环境动态模型进行策略学习的过程中无须再与环境进行交互.在无模型强化学习中,智能体通过与环境进行实时交互来学习最优策略,该方法在实际任务中具有更好的通用性,因此应用范围更广.文中对无模型强化学习的最新研究进展与发展动态进行了综述.首先介绍了强化学习、模型化强化学习和无模型强化学习的基础理论;然后基于价值函数和策略函数归纳总结了无模型强化学习的经典算法及各自的优缺点;最后概述了无模型强化学习在游戏AI、化学材料设计、自然语言处理和机器人控制领域的最新研究现状,并对无模型强化学习的未来发展趋势进行了展望.

    人工智能强化学习深度强化学习无模型强化学习马尔可夫决策过程

    基于LSTM-Attention的RFID移动对象位置预测

    刘嘉琛秦小麟朱润泽
    188-195页
    查看更多>>摘要:随着射频识别(RFID)技术的不断发展,其相比全球定位系统(GPS)具有高精度、数据信息量大的优势,将其应用于智能交通以预测移动对象位置受到广泛关注.然而,由于其定位基站分布离散,并且不同基站对位置预测的影响权重不同,以及长期的历史信息会来带维数灾难等,移动对象的位置预测面临着严峻的挑战.针对这些挑战,在分析现有预测算法的不足的基础上,提出了一种长短期记忆网络(LSTM)和注意力(Attention)机制相结合的机器学习模型(LSTM-Attention).该算法将one-hot编码后的输入向量通过神经网络进行降维处理后,利用注意力机制来发掘不同的定位基站对位置预测的权重影响,最后进行位置预测.在南京交管局提供的RFID数据集上进行的对比实验表明,与现有算法相比,所提算法在预测准确性上有明显的提升.

    RFID降维位置预测长短期记忆网络注意力机制

    实时低功耗飞行器神经网络

    张英陶磊岩曹健王世会...
    196-200页
    查看更多>>摘要:为了满足飞行器实时飞行过程中对大量异构输入数据的信息处理需求,文中提出了一种神经网络,其包括卷积定点滑动核、池化压缩量化核以及全连接压缩融合核,将飞行器异构传感器多路并行数据作为系统的输入,将辨识结果作为系统的输出.卷积滑动窗口核通过排除冗余数据的滑动窗快速实现数据特征的提取;池化压缩量化核使用压缩量化技术来提高系统的执行效率;全连接压缩融合核经删减量化后压缩融合并输出.该设计满足了飞行器对高可靠性、低功耗的在线智能集成需求.使用所提压缩量化方法,准确率最高可达98.54%,压缩率为77.8%,运行速度提升了40倍.

    低功耗神经网络实时在线飞行器

    基于KNN与矩阵变换的图节点嵌入归纳式学习算法

    贺苗苗郭卫斌
    201-205页
    查看更多>>摘要:图节点的低维嵌入在各种预测任务中是非常有用的,如蛋白质功能预测、内容推荐等.然而,多数方法不能自然推广到不可见节点.图采样聚合算法(Graph Sample and Aggregate,Graphsage)虽然可以提高不可见节点生成嵌入的速度,但容易引入噪声数据,且生成的节点嵌入的表示能力不高.为此,文中提出了一种基于KNN与矩阵变换的图节点嵌入归纳式学习算法.首先,通过KNN选取K个邻节点;然后,根据聚合函数生成聚合信息;最后,利用矩阵变换与全连接层对聚合信息和节点信息进行计算,得到新的节点嵌入.为了有效权衡计算时间与性能,文中提出一种新的聚合函数,对邻节点特征运用最大池化作为聚合信息输出,以更多地保留邻节点信息,降低计算代价.在reddit和PPI两个数据集上的实验表明,所提算法在micro-f1和macro-f1两个评价指标上分别获得了4.995%与10.515%的提升.因此,该算法可以大幅减少噪声数据,提高节点嵌入的表示能力,快速有效地为不可见节点及不可见图生成节点嵌入.

    低维嵌入KNN节点嵌入聚合函数表示能力

    基于聚类与特征融合的蛋白质亚细胞定位预测

    王艺皓丁洪伟李波保利勇...
    206-213页
    查看更多>>摘要:蛋白质亚细胞的定位预测不仅是研究蛋白质结构和功能的重要基础,还对了解某些疾病的发病机理、药物设计与发现具有重要意义.然而,如何利用机器学习精准预测蛋白质亚细胞的位置一直是一项具有挑战性的科学难题.针对这一问题,提出了一种基于聚类与特征融合的蛋白质亚细胞定位方法.首先将自相关系数法和熵密度法引入蛋白质特征表达模型的构建,并在传统的PseAAC(Pseudo-amino Acid Composition)的基础上提出了一种改进型PseAAC方法.为了更好地表达蛋白质序列信息,文中首先将自相关系数法、熵密度法和改进型PseAAC进行融合,构造了一种全新的蛋白质序列表征模型;然后利用主成分分析法对融合后的特征向量进行降维,将结果输入到LibD3 C集成分类器,对蛋白质亚细胞进行分类预测,并采用留一法在Gram-positive和Gram-negative数据集上进行交叉检验;最后将取得的实验结果与其他现有算法进行比较.实验结果表明,所提方法在Gram-positive和Gram-negative数据集上分别取得了99.24%和95.33%的预测准确率,说明所提方法具有科学性和有效性.

    特征融合聚类自相关系数伪氨基酸组分法主成分分析法

    基于加权样本和共识率的标记传播算法

    储杰张正军汤鑫瑶黄振生...
    214-219页
    查看更多>>摘要:标记传播是使用最广泛的半监督分类方法之一.基于共识率的标记传播算法(Consensus Rate-based Label Propaga-tion,CRLP)通过汇总多个聚类方法以合并数据各种属性得到的共识率来构造图.然而,CRLP算法与大多数基于图的半监督分类方法一样,在图中将每个标记样本视为同等重要,它们主要通过优化图的结构来提高算法的性能.事实上,样本不一定是均匀分布的,不同的样本在算法中的重要性也是不同的,并且CRLP算法容易受聚类数目和聚类方法的影响,对低维数据的适应性不足.针对这些问题,文中提出了一种基于加权样本和共识率的标记传播算法(Label Propagation Algorithm Based on Weighted Samples and Consensus-Rate,WSCRLP).WSCRLP算法首先对数据集进行多次聚类,以探索样本的结构,并结合共识率和样本的局部信息构造图;然后为不同分布的标记样本分配不同的权重;最后基于构造的图和加权样本进行半监督分类.在真实数据集上的实验表明,WSCRLP算法对标记样本进行加权和构造图的方法可以显著提高分类准确率,在84%的实验中都优于对比方法.相比CRLP算法,WSCRLP算法不仅具有更好的性能,而且对输入参数具有鲁棒性.

    加权样本共识率标记传播半监督分类

    面向铁路文本分类的字符级特征提取方法

    鲁博仁胡世哲娄铮铮叶阳东...
    220-226页
    查看更多>>摘要:铁路文本分类对于我国铁路事业的发展具有重要的实用意义.现有的中文文本特征提取方法依赖于事先对文本的分词处理,然而面向铁路文本数据进行分词的准确率不高,导致铁路文本的特征提取存在语义理解不充分、特征获取不全面等局限性.针对以上问题,提出了一种字符级特征提取方法CLW2V(Character Level-Word2Vec),有效地解决了铁路文本中专业词汇丰富且复杂度高所导致的问题.与基于词汇特征的TF-IDF和Word2Vec方法相比,基于字符特征的CLW2V方法能够提取更为精细的文本特征,解决了传统方法依赖事先分词而导致的特征提取效果不佳的问题.在铁路安监发牌数据集上进行的实验验证表明,面向铁路文本分类的CLW2V特征提取方法优于传统的依赖分词的TF-IDF和Word2Vec方法.

    铁路短文本字符级数据特征提取方法文本分类

    基于过程监督的序列多任务法律判决预测方法

    张春云曲浩崔超然孙皓亮...
    227-232页
    查看更多>>摘要:法律判决预测是人工智能技术在法律领域的应用,因此对法律判决预测方法的研究对于实现智慧司法具有重要的理论价值和实际意义.传统的法律判决预测方法大都是只进行单一任务的预测或仅基于参数共享的多任务预测,并未考虑各子任务之间的序列依存关系,因此预测性能难以得到进一步的提升.文中提出了一个端到端的基于过程监督的序列多任务法律判决预测模型,在建模各子任务之间的依存关系时,通过引入过程监督来确保依赖信息的准确性,从而提升序列子任务的预测性能.将所提模型应用到CAIL2018数据集上,取得了较好的分类效果,平均分类准确率比现有的state-of-the-art方法的准确率提升了2%.

    法律判决预测多任务学习过程监督深度学习

    基于上下文相关字向量的中文命名实体识别

    张栋陈文亮
    233-238页
    查看更多>>摘要:命名实体识别(NER)旨在识别出文本中的专有名词,并对其进行分类.由于用于监督学习的训练数据通常由人工标注,耗时耗力,因此很难得到大规模的标注数据.为解决中文命名实体识别任务中因缺乏大规模标注语料而造成的数据稀缺问题,以及传统字向量不能解决的一字多义问题,文中使用在大规模无监督数据上预训练的基于上下文相关的字向量,即利用语言模型生成上下文相关字向量以改进中文NER模型的性能.同时,为解决命名实体识别中的未登录词问题,文中提出了基于字语言模型的中文NER系统.把语言模型学习到的字向量作为NER模型的输入,使得同一中文汉字在不同语境中有不同的表示.文中在6个中文NER数据集上进行了实验.实验结果表明,基于上下文相关的字向量可以很好地提升NER模型的性能,其平均性能F1值提升了4.95%.对实验结果进行进一步分析发现,新系统在OOV实体识别上也可以取得很好的效果,同时对一些特殊类型的中文实体识别也有不错的表现.

    命名实体识别语言模型上下文相关字向量