首页期刊导航|计算机科学
期刊信息/Journal information
计算机科学
计算机科学

朱完元

月刊

1002-137X

jsjkx12@163.com

023-63500828

401121

重庆市渝北区洪湖西路18号

计算机科学/Journal Computer ScienceCSCD北大核心CSTPCD
查看更多>>本刊的读者对象是:大专院校师生,从事计算机科学与技术领域的科研、生产人员。办刊宗旨是:坚持“双百”方针,活跃计算机科学与技术领域的学术气氛,重点报导国内外计算机科学与技术的发展动态,为我国的计算机科学与技术立于世界之林、达到国际先进水平奋斗而矢志不渝。
正式出版
收录年代

    DRSTN:深度残差软阈值化网络

    曹岩朱真峰
    81-87页
    查看更多>>摘要:在采用深度残差等神经网络模型解决图像分类任务时,特征提取过程损失的一些重要特征会影响模型的分类性能.神经网络"端到端"的学习模式带来的黑盒问题,也会限制其在诸多领域的应用和发展.另外,神经网络模型往往需要较长的训练时间.为了提高深度残差网络模型的分类效果和训练效率,引入了模型迁移方法和软阈值化方法,提出了DRSTN(Deep Re-sidual Soft Thresholding Network)网络,并对此网络结构进行微调,生成了不同版本的DRSTN网络.DRSTN网络的性能得益于3个方面的有机整合:1)通过梯度加权类激活映射(Gradients-weighted Class Activation Mapping,Grad-CAM)方法对网络的特征提取进行可视化,根据可视化结果挑选进一步优化的模型;2)基于模型迁移,研究人员不必全新地搭建模型,可以直接在已有的模型上进行优化,能够节省大量训练时间;3)软阈值化作为非线性变换层嵌入到深度残差网络体系结构中,以消除样本中不相关的特征.实验结果表明,在相同训练条件下,DRSTN_KS(3*3)_RB(2:2:2)网络在CIFAR-10数据集上的分类精度相比SKNet-18,ResNet18和ConvNeXt_tiny网络分别提高了15.5%,8.8%和10.9%;该网络也具有一定的泛化性,在MNIST和Fashion MNIST数据集上能够达到快速的迁移效果,分类精度分别达到99.06%和93.15%.

    迁移学习残差网络梯度加权类激活映射软阈值化方法图像分类

    基于多策略改进的人工蜂鸟算法

    李振冯锋
    88-96页
    查看更多>>摘要:针对人工蜂鸟算法(AHA)在迭代过程中出现全局勘探能力不足和收敛速度较慢的问题,提出了一种多策略改进的人工蜂鸟算法(IAHA).首先,采用融合Tent混沌映射与反向学习的策略对种群进行初始化,生成高质量的初始种群,为算法全局寻优奠定基础;然后,在引导觅食阶段引入莱维飞行策略以提高全局搜索能力,使算法能够快速跳出局部最优,加快收敛速度;最后,将单纯形法引入算法中,在每一次迭代结束前对质量较差的种群进行处理,提高算法的局部寻优能力.将IAHA分别与4种基本算法、3种单改进阶段的人工蜂鸟算法、2种现有的改进人工蜂鸟算法进行对比,对8个基准测试函数进行仿真实验以及Wilcoxon秩和检验,对IAHA性能进行评估,并分析其时间复杂度.实验结果表明,与上述所提的算法相比,IAHA的收敛速度更快,全局寻优能力更强,算法性能更佳.

    人工蜂鸟算法Tent混沌莱维飞行单纯形法

    主实体增强型层叠指针网络在中文医学实体关系抽取中的应用

    姜植瀚昝红英张莉
    97-102页
    查看更多>>摘要:随着中国医学事业的快速发展,中文医学文本的数量不断增加.为了从这些中文医学文本中提取有价值的信息,并解决中文医学领域的实体关系抽取问题,研究人员已经提出一系列基于双向LSTM的模型.然而,由于双向LSTM的训练速度等问题,文中引入了层叠指针网络框架来处理中文医学文本的实体关系抽取任务.为了弥补层叠指针网络框架中主实体识别能力不足以及解决复用编码层时的梯度问题,文中提出了主实体增强模块,并引入了条件层归一化方法,从而提出了面向中文医学文本的主语增强型层叠指针网络框架(Subject Enhanced Cascade Binary Pointer Tagging Framework for Chinese Medical Text,SE-CAS).通过引入主实体增强模块,能够精确识别有效的主实体,并排除错误实体.此外,还使用条件层归一化方法来替代原模型中的简单相加方法,并将其应用于编码层和主实体编码层.实验结果证明,所提模型在CMeIE数据集上取得了5.73%的F1值提升.通过消融实验证实,各个模块均能带来性能提升,并且这些提升具有叠加效应.

    实体关系抽取层叠指针网络医学关系抽取深度学习主语识别

    基于DAN与FastText的藏文短文本分类研究

    李果陈晨杨进群诺...
    103-107页
    查看更多>>摘要:随着藏文信息不断融入社会生活,越来越多的藏文短文本数据存在网络平台上.针对传统分类方法在藏文短文本上分类性能低的问题,文中提出了一种基于DAN-FastText的藏文短文本分类模型.该模型使用FastText网络在较大规模的藏文语料上进行无监督训练获得预训练的藏文音节向量集,使用预训练的音节向量集将藏文短文本信息转化为音节向量,把音节向量送入DAN(Deep Averaging Networks)网络并在输出阶段融合经过FastText网络训练的句向量特征,最后通过全连接层和softmax层完成分类.在公开的TNCC(Tibetan News Classification Corpus)新闻标题数据集上所提模型的 Macro-F1是64.53%,比目前最好评测结果TiBERT模型的Macro-F1得分高出2.81%,比GCN模型的Macro-F1得分高出6.14%,融合模型具有较好的藏文短文本分类效果.

    藏文短文本分类特征融合深度平均网络快速文本

    基于不变图卷积神经网络的文本分类

    黄瑞徐计
    108-112页
    查看更多>>摘要:文本分类是自然语言处理中一个基本而又重要的任务,近年来,图神经网络被越来越多地应用于文本分类中.然而,使用图神经网络的图表示学习在涉及文本分类的任务中不能很好地满足新词的归纳学习,其一般假设训练和测试数据来自相同的分布,但现实中这个假设经常不成立.为了克服这些问题,文中提出了Invariant-GCN,用于通过GCN进行归纳文本分类.首先为每个文档构建单个图,使用GCN根据其局部结构学习细粒度的单词表示,这可以有效地为新文档中没见过的单词生成嵌入进而将单词节点作为文档嵌入合并;然后提取最大限度地保留不变类内信息的期望子图,使用这些子图进行学习不受分布变化的影响;最后通过图分类方法完成文本分类.在4个基准数据集上与5种分类方法进行了比较,实验结果表明Invariant-GCN 具有良好的文本分类效果.

    文本分类图卷积神经网络因果学习文本图构建

    基于Transformer的司法文书命名实体识别方法

    王颖洁张程烨白凤波汪祖民...
    113-121页
    查看更多>>摘要:命名实体识别是自然语言处理领域的关键任务之一,是实现下游任务的基础.目前针对司法领域的相关研究相对较少,司法系统的信息化和智能化转型仍有许多问题亟需解决.相比其他领域的文本,司法文书存在专业性强、语料资源少等局限,导致现有的司法文书识别结果较低.因此,从以下3方面开展研究:首先,提出了一种多标签层级迭代的文本标注方式,可以对原始司法文书文本进行自动化标注,同时有效地提升司法文书命名实体识别任务的实体识别效果;其次,提出了一种交融式的Transformer神经网络模型,对汉字固有属性的深层特征进行了充分利用,用于对司法文书进行命名实体识别;最后,对所提出的标注方法和模型与其他神经网络模型进行了对比实验.所提出的文本标注方式可以较为准确地实现司法文书的标注任务;同时,所提出的模型在通用数据集中相对于对照模型有较大的提高,并在司法领域数据集中取得了良好的效果.

    自然语言处理数据标注Transformer模型深度学习司法信息化

    融合BERT模型与词汇增强的中医命名实体识别模型

    李旻哲殷继彬
    122-127页
    查看更多>>摘要:现有的中医命名实体识别相关研究较少,基本都是基于中文病例做相关研究,在传统中医编写的病例文本中表现不佳.针对中医案例中命名实体密集且边界模糊难以划分的特点,提出了一种融合词汇增强和预训练模型的中医命名实体识别方法LEBERT-BILSTM-CRF.该方法从词汇增强和预训练模型融合的角度进行优化,将词汇信息输入到BERT模型中进行特征学习,达到划分词类边界和区分词类属性的目的,提高中医医案命名实体识别的精度.实验结果表明,在文中构建的中医病例数据集上针对10个实体进行命名实体识别时,提出的基于LEBERT-BILSTM-CRF的中医案例命名实体识别模型综合准确率、召回率、F1分别为88.69%,87.4%,88.1%,高于BERT-CRF,LEBERT-CRF等常用命名实体识别模型.

    自然语言处理中医案例词汇增强BERTBLSTM-CRF

    融合标签知识的中文医学命名实体识别

    尹宝生周澎
    128-134页
    查看更多>>摘要:医学领域命名实体识别是信息抽取任务重要的研究内容之一,其训练数据主要来源于临床实验数据、健康档案、电子病历等非结构化文本,然而标注这些数据需要专业人员耗费大量人力、物力和时间资源.在缺乏大规模医学训练数据的情况下,医学领域命名实体识别模型很容易出现识别错误的情况.为解决这一难题,文中提出了一种融合标签知识的中文医学命名实体识别方法,即通过专业领域词典获得文本标签的释义后,分别将文本、标签及标签释义编码,基于自适应融合机制进行融合,有效平衡特征提取模块和语义增强模块的信息流,从而提高模型性能.其核心思想在于医学实体标签是通过总结归纳大量医学数据得到的,而标签释义是对标签进行科学解释和说明的结果,模型融入这些蕴含了丰富的医学领域内的先验知识,可以使其更准确地理解实体在医学领域中的语义并提升其识别效果.实验结果表明,该方法在中文医学实体抽取数据集(CMeEE-V2)3个基线模型上分别取得了0.71%,0.53%和1.17%的提升,并且为小样本场景下的实体识别提供了一个有效的解决方案.

    中文医学命名实体识别标签知识先验知识自适应融合机制小样本

    融合HousE和注意力机制的知识推理模型

    朱玉亮刘俊涛饶子昀张毅...
    135-142页
    查看更多>>摘要:知识推理技术是解决知识图谱缺失问题所提出的方法,并在近年来不断发展.为了解决推理中准确度低、可解释性差、适用性不强等问题,提出了一种融合注意力机制和HousE的知识推理模型Att-HousE.该模型由一个带注意力机制的规则生成器和一个带HousE嵌入的规则预测器组成,规则生成器生成推理需要的规则并传入预测器,预测器更新并得到不同规则的得分,然后通过EM算法不断训练优化生成器与预测器.具体而言,该模型是建立在RNNLogic的基础上并作出改进,注意力机制可以选取更值得关注的关系作为规则,提高了模型准确度,HousE嵌入则在处理复杂关系上更具有灵活性,并适用于建立多边关系.在公开实验数据集上的结果表明,Att-HousE在FB15K-237上做推理任务时,MRR指标整体比RNNLogic高出6.3%;在稀疏数据集WN18RR上,Hits@10指标整体比RNNLogic高出2.7%,证明了引入HousE和注意力机制后可以更全面地抓取和形成多边关系,提升知识推理的精度.

    知识图谱补全知识推理注意力机制知识表示EM算法

    结合对话状态信息的个性化对话回复生成

    桂海涛王中卿
    143-149页
    查看更多>>摘要:尽管个性化回复生成模型取得了显著成功,但这些研究都未能很好地考虑到对话状态信息对于个性化对话回复的影响.针对此问题,基于预训练生成模型提出了结合对话状态的自监督对话回复生成模型,该模型可以有效地对结合对话状态生成个性化的回复.首先,将对话状态纳入情景喜剧数据集中,以增强模型对上下文信息的理解能力.其次,采用自监督的训练技术,赋予预训练语言生成模型独特的对话文本特征知识,并采用多种掩码策略合并对话文本和对话状态,进一步提升模型性能.最后,基于历史对话,使用自监督生成模型生成个性化回复.在自行收集的情景喜剧数据集上进行性实验,结果表明,结合对话状态的对话回复生成模型在多项指标上优于一些强基准,进而证明了对话状态和个性化回复生成模型的有效性.

    对话回复对话状态自监督预训练文本生成