首页期刊导航|计算机科学
期刊信息/Journal information
计算机科学
计算机科学

朱完元

月刊

1002-137X

jsjkx12@163.com

023-63500828

401121

重庆市渝北区洪湖西路18号

计算机科学/Journal Computer ScienceCSCD北大核心CSTPCD
查看更多>>本刊的读者对象是:大专院校师生,从事计算机科学与技术领域的科研、生产人员。办刊宗旨是:坚持“双百”方针,活跃计算机科学与技术领域的学术气氛,重点报导国内外计算机科学与技术的发展动态,为我国的计算机科学与技术立于世界之林、达到国际先进水平奋斗而矢志不渝。
正式出版
收录年代

    基于自适应时间戳与多尺度特征提取的轨迹下一足迹预测模型

    李艾玲张凤荔高强王瑞锦...
    191-197页
    查看更多>>摘要:基于位置的服务已经成为人类生活方式的一部分,各种移动终端设备产生了大量时空上下文用户信息,其可被用于预测用户的下一个足迹.目前已提出一些解决方案来预测用户下一个足迹,包括递归运动函数(RMF)、矩阵分解(MF)、差分自回归移动平均模型(ARIMA)、马尔可夫链(MC)、个性化马尔可夫链(FPMC)、卡尔曼滤波器(KF)、高斯混合模型和张量分解(TF).除此之外,也可以使用诸如ST-RNN,POI2Vec,DeepMove,VANext等深度神经网络方法来预测用户的下一个足迹,这些方法利用递归神经网络(RNN)捕获来自人类活动的顺序运动模式.然而,现有方法使用一些人为设定的阈值来分割人类移动性数据以进行用户运动模式学习,人为固定时间戳设置不仅引入了人为主观因素,而且忽略了不同用户之间的差异性,这可能会导致移动模式发生偏差;而且现有方法针对用户轨迹特征提取过于单一化,单一特征忽略了很多用户轨迹潜在信息.基于自适应时间戳与多尺度特征提取的轨迹预测模型(AMSNext)旨在首次结合历史轨迹数据的时间统计特性,自适应地为每一个用户定义个性化时间戳,关注不同用户运动模式之间的差异性;并结合时间序列特征提取方法多尺度对用户轨迹特征进行提取,同时为实现多尺度特征量纲统一,将会采取归一化因果嵌入对特征进行向量嵌入.实验证明,该模型可以取得较高的预测精度.

    自适应时间戳时间序列特征提取轨迹预测归一化嵌入

    基于网络表示学习的深度社团发现方法

    潘雨邹军华王帅辉胡谷雨...
    198-203页
    查看更多>>摘要:挖掘复杂网络中的社团结构有助于理解网络内部结构和功能特性,具有重要的理论价值和实际应用意义.随着信息技术的飞速发展,爆炸式增长的网络数据为社团发现任务提出了前所未有的挑战.为此,文中利用深度神经网络将网络表示学习和社团发现领域相连接,提出一种基于网络表示学习的深度社团发现方法.算法首先根据节点潜在的社团成员相似性来量化节点之间的结构相似度,从而构造包含潜在社团结构信息的社团结构矩阵;然后建立由多个非线性函数组成的多层自编码器,将社团结构矩阵作为深度自编码器的输入,获得保存了潜在社团结构的节点低维表示;最后在网络表示上应用K-means聚类策略获得社团结构.在不同规模的真实网络和人工网络上进行了大量的实验,并与典型的算法进行比较,实验结果表明了算法的可行性和有效性.

    社团发现网络表示学习自编码器深度神经网络复杂网络

    用于多元时间序列预测的自适应频域模型

    王晓迪刘鑫于晓
    204-210页
    查看更多>>摘要:近年来,学术和工业领域对时间序列数据的研究热潮不断增长,但其中蕴含的频率信息仍缺乏有效的建模.研究发现,时间序列预测依赖于不同的频率模式,为未来的趋势预测提供有用的线索:短期的序列预测更多依赖于高频分量,而长期预测则更多关注低频数据.为更好地挖掘时间序列的多频模式,提出了一个多特征自适应频域预测模型MAFD.该模型分为两个阶段:在第一阶段中,模型通过XGBoost算法对输入向量进行重要性度量,选择高重要性特征;在第二阶段,模型将时间序列的频率特征提取和目标序列的频域建模集成到一起,并根据时间序列对频率模式的依赖特点构建一个端到端的预测网络.MAFD的创新性体现在预测网络能够根据输入序列的动态演变自动关注不同的频率分量,从而揭示时间序列的多频模式,强化模型的学习能力.采用4种不同领域的数据集对模型进行了性能验证,实验结果表明,与现有经典的预测模型相比,MAFD具有更高的准确性和更小的滞后性.

    时间序列预测XGBoost多频模式深度学习自适应建模

    基于自我中心网络结构特征和网络表示学习的链路预测算法

    赵曼赵加坤刘金诺
    211-217页
    查看更多>>摘要:链路预测是网络分析与挖掘领域中备受关注的研究方向.链路预测算法所预测的网络中的缺失连接实际上是一种数据挖掘的过程,而推断的将来可能产生的连接则与网络的发展演化相关.因此,如何提高链路预测的精确度是一项有意义且具有挑战性的研究.基于自我中心网络分解和社区聚类的最新研究,提出一种基于自我中心网络结构特征和网络表示学习的链路预测算法(Ego-Embedding).Ego-Embedding将原网络转换成角色图,再结合网络的微观结构信息和上下文信息重构嵌入过程,为每一个节点学习一个或多个向量表示,使向量表示更准确地描述网络节点信息,从而提高链路预测的精确度.在3个公开数据集(Facebook,PPI-Yeast和ca-HepTh)上进行实验仿真,并使用AUC作为评价指标,仿真结果表明,算法Ego-Embed-ding的表现均优于5个实验对比方法(CN,AA,Node2vec,M-NMF和Splitter),且最高将链路预测的错误率减少了约47%.

    链路预测自我中心网络网络表示学习角色分解Ego-Embedding

    基于特征相似度计算的网页包装器自适应

    陈迎仁郭莹楠郭享倪一涛...
    218-224,257页
    查看更多>>摘要:随着大数据的发展,互联网数据呈现爆炸式的增长.Web作为一种重要的信息载体,包含了各种类型的信息,而包装器的提出就是为了从杂乱的Web信息中提取出目标数据.但是,随着网页更新的频繁,轻微的结构变化都可能导致原有的包装器失效,增加包装器的维护成本.针对包装器的健壮性以及维护成本问题,提出了一种基于特征相似度计算的网页包装器自适应技术.该技术主要通过解析新网页的特征集合和旧包装器所蕴含的特征信息,通过网页相似度计算,重定位旧包装器在新网页中的映射区域和映射数据项,并根据映射关系使旧包装器能够自适应新网页的数据提取.该技术主要针对各类型网站进行实验,其中包括了购物类、新闻类、资讯类、论坛类和服务类,从中选取了250对新旧版本网页,共500个网页,进行包装器自适应实验.实验结果表明,当网页结构改变时,该方法能够有效地自适应新网页的数据提取,且数据提取的平均精确度和平均召回值分别达到82.2%和84.36%.

    网页数据抽取自适应包装器相似度计算网页特征

    混合部署数据中心失效负载分析

    蒋从锋殷继亮胡海周闫龙川...
    225-231,264页
    查看更多>>摘要:数据中心工作负载混合部署在显著提升云数据中心的资源利用率的同时,也增加了调度的复杂性和作业的失效率.以阿里云发布的数据中心日志数据集cluster-trace-v2018为例,从离线批处理工作负载角度出发,详细地分析了不同类型工作负载在成功率和资源利用上的特征.主要发现如下:1)少量类型作业的失效会影响集群整体作业成功率并造成集群资源的浪费;2)伏羲分布式调度系统在任务故障切换执行时间上满足高斯分布,在任务调度延迟方面满足齐夫分布;3)通过分析失败实例在集群节点上的分布,发现集群作业发生失败在空间上具有随机性,且失败的实例很容易再次发生失败,而在时间上集群整体失败率则存在不平衡性;4)以任务实例的失效为基准,计算了集群节点的平均无故障时间,大部分节点的平均无故障时间在1000 s左右,小部分节点的任务实例失效率低,其平均无故障时间可达10000 s以上.

    混合部署工作负载特征分布式调度失效分析

    网上购物平台多推荐融合算法研究

    朱育颉刘虎沉
    232-235页
    查看更多>>摘要:推荐系统能帮助用户有效解决信息过载问题,现已被广泛应用于各大网上的购物平台.对用户而言,好的推荐算法能够帮助其从海量商品中快速准确发现符合自己需求的商品;对商家而言,及时呈现给用户恰当的物品能帮助商家实现精准营销,发掘长尾商品并推荐给感兴趣的用户以提高销售额.协同过滤、基于内容推荐是目前应用成熟的推荐方法,但这些方法存在数据疏散、冷启动、可扩展性差和多媒体信息特征难以提取等问题.因此,文中提出基于融合LR-GBDT-XGBOOST的个性化推荐算法,可有效缓解上述问题.在阿里巴巴天池大数据竞赛公开数据集上进行实验,结果显示,该算法降低了推荐稀疏性,提高了推荐精度.

    电子商务推荐系统协同过滤混合推荐

    基于KL-Ball的社区挖掘方法

    娄铮铮王冠威李辉吴云鹏...
    236-243页
    查看更多>>摘要:针对邻接矩阵的稀疏特性,采用KL散度来计算网络节点间的距离,提出了一种基于KL-Ball的社区挖掘方法.该方法中,一个KL-Ball代表一个社区,它从质心、半径、互信息及密度4个方面来描述社区,其中质心决定了社区在网络中的位置,半径刻画了社区所能覆盖的范围,互信息度量了社区中包含节点的一致性,密度反映了社区包含节点的数量.给定一个半径,期望从复杂网络中寻找具有低信息、高密度的社区,低信息使得社区包含的节点具有较强的一致性,高密度使得一个社区具有较强的凝聚性.为此,定义了一个基于KL-Ball的社区挖掘目标函数,给出它的优化算法,并从理论上证明了该算法的收敛性.依据社区半径的大小及质心的位置,该算法可应用于非重叠社区挖掘以及重叠社区挖掘.实验结果表明,基于KL-Ball的社区挖掘方法可有效地挖掘网络中蕴含的社区结构,包括非重叠的社区及重叠的社区.

    社区挖掘KL散度非重叠社区重叠社区

    知识图谱嵌入的高阶协同过滤推荐系统

    徐兵弋沛玉王金策彭舰...
    244-250页
    查看更多>>摘要:针对推荐系统存在的数据稀疏问题,传统的协同过滤方法无法捕捉辅助信息之间的相关性,从而降低了推荐的准确度,文中提出KGE-CF模型,引入了知识图谱作为辅助信息,利用知识图谱中多源结构性的数据来缓解数据稀疏问题.KGE-CF结合多层感知机捕获高阶非线性特征的能力,能够学习出用户与项目更深层次的交互信息,从而提升推荐质量.首先,KGE-CF模型将用户的历史交互项目与知识图谱中的实体进行映射,并且利用知识图谱的翻译模型进行训练,得到实体嵌入向量与关系向量,并依据"兴趣迁移"思想进一步学习出更为丰富的用户向量;然后,模型将学习得到的用户向量与项目向量拼接,作为多层感知机的输入,捕捉用户与项目之间的高阶特征信息;最后,通过一个sigmoid函数得到用户对候选项目的偏好程度.通过在真实数据集上的实验,证明了提出的KGE-CF模型在点击率预测和top-k两种推荐场景下均优于其他方法.

    知识图谱多层感知机推荐系统协同过滤数据稀疏性

    基于用户兴趣词典和LSTM的个性化情感分类方法

    王友卫朱晨朱建明李洋...
    251-257页
    查看更多>>摘要:微博是一个可以分享生活、发表看法、发泄情感的社交平台,由于数据量大且易于获取,微博数据已被广泛用于网络用户情感分析.传统对微博进行情感预测的研究没有考虑用户的用词喜好、语言风格等个性化因素的影响,使得情感分类结果的准确性不高.首先通过分析用户兴趣特征构建用户兴趣词典,在此基础上提出基于用户兴趣词典的情感分类模型;然后利用长短期记忆网络(Long Short-Term Memory,LSTM)分类准确性高的特点训练一个通用的LSTM分类模型;最后利用支持向量机融合不同模型以得到最终的情感分类结果.实验结果表明,与支持向量机、朴素贝叶斯等传统分类器相比,基于用户兴趣词典与LSTM的个性化情感分类方法在分类精度上有较大提升;与LSTM、循环神经网络等深度学习方法相比,该方法在保证运行效率的前提下能获得更高的分类精度.

    情感分类用户兴趣词典LSTM模型支持向量机