首页期刊导航|计算机科学
期刊信息/Journal information
计算机科学
计算机科学

朱完元

月刊

1002-137X

jsjkx12@163.com

023-63500828

401121

重庆市渝北区洪湖西路18号

计算机科学/Journal Computer ScienceCSCD北大核心CSTPCD
查看更多>>本刊的读者对象是:大专院校师生,从事计算机科学与技术领域的科研、生产人员。办刊宗旨是:坚持“双百”方针,活跃计算机科学与技术领域的学术气氛,重点报导国内外计算机科学与技术的发展动态,为我国的计算机科学与技术立于世界之林、达到国际先进水平奋斗而矢志不渝。
正式出版
收录年代

    基于注意力的多尺度蒸馏异常检测

    乔虹邢红杰
    634-644页
    查看更多>>摘要:基于知识蒸馏的异常检测方法中,教师网络远大于学生网络,使得所得特征表示在同一位置对应图像的感受野不同.为解决此问题,可使学生网络与教师网络结构相同.然而,学生与教师网络完全相同,使得在测试阶段,对于异常样本,教师网络与学生网络特征表示差异过小而影响异常检测的性能.为解决该问题,提出了基于高效通道注意力模块的多尺度知识蒸馏异常检测方法(ECA Based Multi-Scale Knowledge Distillation Anomaly Detection,EC A-MSKDAD),并结合数据增强操作提出了相对距离损失函数.使用经过预训练的网络作为教师网络,同时使用与教师网络结构相同的网络作为学生网络.在训练阶段,对训练样本采取数据增强操作以扩充训练集的规模,并在学生网络中引入高效通道注意力(Efficient Channel Attention,ECA)模块,以增加教师网络和学生网络之间的差异,增大异常数据的重构误差,进而提高模型的检测性能.此外,利用相对距离损失函数,将数据间关系从教师网络传递到学生网络,对学生网络的网络参数进行优化.在MVTec AD进行实验,与9种相关方法比较,所提方法在异常检测与异常定位上均取得更优的性能.

    深度学习异常检测异常定位知识蒸馏注意力机制

    基于方差迁移的非平衡数据过采样方法

    郑一凡王卯宁
    645-650页
    查看更多>>摘要:重采样是解决非平衡数据分类问题的重要方法.但在数据集很小的情况下,欠采样会丢失数据集的重要信息,因此过采样是非平衡数据分类问题的研究重点.现有的过采样方法虽然部分解决了类间不平衡问题,但是本质上并未给少数类引入额外的信息,且仍然存在着过拟合的风险.针对这些问题,提出了一种基于多数类方差迁移的少数类合成方法(Variance Transfer Oversampling,VTO),从足够多样化的多数类中提取样本偏移向量,综合少数类和多数类的特征权重矩阵以调整,最终将经过置信条件筛选的偏移向量叠加至少数类样本中心,从而在少数类样本生成中引入多数类方差,进而丰富少数类特征空间.为了验证所提算法的有效性,使用决策树为分类模型在6个KEEL数据集上训练,对比SMOTEENN等其他过采样方法,以F-score和PR-AUC值为评价指标进行了实验.结果显示,该算法在处理非平衡数据分类问题时具有更大优势.

    非平衡数据分类过采样方差迁移协方差

    一种适用于大图的k步可达性查询算法

    同正南卜天明
    651-660页
    查看更多>>摘要:k步可达查询用于在给定的有向无环图(Directed Acyclic Graph,DAG)中回答两点之间是否存在长度不超过k的路径.针对现有方法的索引规模大、查询处理效率低的问题,提出了一种构建在大图上的基于树覆盖的倍增索引来提高索引查询效率,并结合GRAIL算法和改进的FELINE算法对本身就不可达查询点对进行剪枝.基于19个真实的数据集进行了实验测试,并将所提算法与现有算法在构建索引大小、索引时间、查询时间3个指标上进行了实验对比.实验结果验证了所提算法的高效性.

    k步可达性查询倍增索引索引标签树覆盖在线搜索

    融入类别标签和主题信息的用户兴趣识别方法

    康智勇李弼程林煌
    661-668页
    查看更多>>摘要:社交网络用户兴趣发现对信息过载缓解、个性化推荐和信息传播正向引导等方面具有重要意义.目前已有的兴趣识别研究未能同时考虑文本主题信息及其对应的类别标签信息对模型学习文本特征的帮助,文中提出了一种融入类别标签和主题信息的用户兴趣识别方法.首先,利用BERT预训练模型、BiLSTM模型和多头自注意力机制分别获取文本和标签序列的语义特征;其次,引入标签注意力机制,使模型更加关注文本与其类别标签更相关的词语信息;然后,利用LDA主题模型和Word2Vec模型得到文本主题特征;接着,设计门控机制进行特征融合,使模型能够自适应地融合多种特征,进而实现微博文本兴趣类别分类;最后,统计用户发表的所有文本在各个兴趣类别上的数量,将数量最多的兴趣类别确定为用户兴趣识别结果.为验证所提方法的有效性,文中构建了一个微博兴趣识别数据集.实验结果表明,该模型在微博文本兴趣类别分类和用户兴趣识别任务中均取得了最优性能.

    社交网络兴趣识别主题模型标签注意力机制特征融合

    基于轻量级图卷积和隐式反馈增强的多样化推荐

    黄春淦王桂平吴波白鑫...
    669-679页
    查看更多>>摘要:近年来,研究人员一直在努力提高推荐系统的准确性,而忽视了多样化对用户满意度的重要影响.目前大多数多样化推荐算法在传统算法生成的准确性候选列表后施加多样性约束进行后处理.然而,这种解耦设计总是导致推荐系统的次优状态.与此同时,尽管利用图卷积神经(Graph Convolution Networks,GCN)的推荐算法在提高推荐准确性方面的有效性已得到证实,但用于推荐的适用性和多样性设计仍然被忽视.此外,推荐算法采用用户购买这一单一的显式反馈无可避免地陷入"推荐过剩".因此,提出一种端到端的多样化轻量级图卷积网络推荐模型(Diversified Light Graph Convolution Networks Recom-mendation,DLGCRec)来克服以上弊端.首先,将图卷积简化为轻量级图卷积(Light Graph Convolution Networks,LGCN)以便于推荐,并利用轻量级图卷积将多样化推向上游准确性匹配推荐过程.然后,在轻量级图卷积的采样阶段,利用引入了用户隐式反馈的多样性增强负采样来探索用户的多样化偏好.最后,利用多层特征融合策略捕获节点的完整特征嵌入,提升推荐性能.在真实数据集上进行实验,结果验证了DLGCRec在适用推荐和提升多样性方面的有效性.进一步的消融研究证实,DL-GCRec 有效地缓解了准确性-多样性困境.

    推荐系统多样性图卷积隐式反馈准确性-多样性困境

    基于图自编码器和GRU网络的分层交通流预测模型

    赵子琪杨斌张远广
    680-685页
    查看更多>>摘要:准确的交通流预测信息不仅可以为交通管理人员提供交通决策的坚实基础,还可以减少交通拥堵情况.在交通流预测任务中,获得有效的交通流的时空特性是保证预测效果的前提.现有的方法大多是用未来时刻的数据进行监督学习,提取的特征具有局限性.针对现有预测模型无法充分挖掘交通流的时空特性的问题,提出了基于改进的图自编码器和门控循环单元的分层交通预测模型.首先使用图注意力自编码器以无监督的方式深度挖掘交通流的空间特性,然后使用门控循环单元进行时间特征提取.分层结构采用分开训练的方式进行时空依赖关系的学习,旨在获取路网天然存在的空间拓扑特征,使其可以兼容不同时间步下的交通流预测任务.大量实验证明,所提出的GAE-GRU模型在不同数据集下的交通预测任务中取得了优异的表现,MAE,RMSE和MAPE指标均优于基线模型.

    交通流预测图自编码器门控循环单元分层时空依赖

    基于改进主题模型方法的三级短视频用户画像的研究

    黄玉民赵婵婵
    686-692页
    查看更多>>摘要:针对如何从海量短视频数据、用户数据、交互数据中快速抽象出精准的用户兴趣的问题,提出了基于主题模型的三级标签用户画像构建方法.基于主题构建方法,将融合的LDA和GSDMM主题模型所获取的视频主题词作为用户兴趣表达向量.首先,搭建了LDA过滤器,通过比对闯值剔除与主题无关的文本信息,缩小文本规模,降低非主要语料对于兴趣表达向量生成的影响.然后,提出结合语义信息和语境信息的特征词权重矩阵的构建方法,使用Bi-GRU神经网络计算词向量的上下文特征,并将其作为语境特征,使用TF-IDF算法计算出的词频权重作为语义特征,结合语境和语义特征扩充特征词含义.最后使用带有兴趣权重分配的GSDMM模型学习特征向量权重矩阵,实现用户兴趣标签生成和用户不同喜好程度影响下的兴趣权重修正.实验结果表明,该方法能够比较完备准确地表征用户画像,优于单一的主题构建方法,并且在聚类效果上表现出色.通过构建完备的用户画像,能够精准把握用户痛点,为后续个性化推荐提供服务.

    短视频用户画像主题分析模型语义权重语境权重

    基于本体驱动的航空情报表格信息结构化研究

    赖欣李思宁梁昌盛张恒嫣...
    693-699页
    查看更多>>摘要:航空资料汇编是国际民航组织推荐的呈现各国航空信息的主要载体,其中以表格数据形式汇总了大量航空数据与航空运行限制信息.为实现航空汇编资料的智能查询,以及对航空资料汇编中静态数据的挖掘与利用,需要对航空汇编资料中的表格信息予以特征提取与结构化处理.将航空资料汇编中表格信息作为研究对象,提出了一种基于本体驱动的航空情报表格信息结构化抽取方法.首先构建航空情报领域信息的本体框架,实现对领域知识统一规范的描述;其次,利用Document AI对表格文档的布局结构进行研究与预处理,并利用随机森林算法与条件随机场模型进行特征实体提取验证与分析.实验结果表明,所提方法能够有效提取航空情报表格中的特征实体,为航空情报领域静态数据深入挖掘提供参考.

    航空情报本体命名实体识别条件随机场随机森林DocumentAI

    RM-RT2NI:融合评论时效与可信近邻影响力的推荐模型

    韩志耕周婷陈耿付纯硕...
    700-706页
    查看更多>>摘要:基于矩阵分解的推荐模型虽然能够处理高维评分数据,但容易遭受评分数据稀疏性的困扰.基于评分和评论的推荐模型通过外加隐藏在评论中的用户偏好与物品属性信息,缓解了评分数据的稀疏性,但在特征提取时大多没有关注评论时效性和可信近邻影响力,无法获得更丰富的用户和物品特征.为进一步提高推荐精度,提出了融合评论时效与可信近邻影响力的推荐模型RM-RT2NI.基于评分矩阵,该模型使用矩阵分解提取了用户偏好和物品属性的浅层特征,利用云模型和修正的用户相似度评估模型和新构建的信度评估模型提取出可信近邻影响力;基于评论文本,该模型利用BERT模型获得每条评论的隐表达,利用双向GRU提取评论间的联系,利用新构建的融合时间因子的注意力机制识别各评论的时效贡献度,以获取用户和物品的深层特征.在此基础上,将用户浅层特征、深层特征以及可信近邻影响力特征融合成用户特征,将物品浅层特征和深层特征融合成物品特征,并将它们输入全连接神经网络以预测用户-物品评分.在5组公开数据集上对RM-RT2NI的推荐性能进行了实验评估,结果显示,与7个基线模型相比,RM-RT2NI具有更高的评分预测精度,且RMSE平均降低了3.0657%.

    推荐模型评分矩阵评论文本评论时效可信近邻影响力多特征融合

    基于SEIR模型的网络热搜话题传播仿真研究

    殷艳艳王克克田姣姣李默...
    707-712页
    查看更多>>摘要:网络热搜话题具有传播扩散现象,当前对于网络热搜话题的研究主要集中在传播效果评估、传播趋势预测、社会影响评价以及舆论引导等方面,而对于网络热搜话题的研究未能揭示传播动力学参数对于传播过程的影响.文中采用SEIR模型构建了网络热搜话题传播动力学模型,分析研究了网络平均度、不信任概率、接触后立即传播概率、感染率、治愈率、复发率等影响因素对模型的影响.

    SEIR网络热搜话题传播