首页期刊导航|计算机科学
期刊信息/Journal information
计算机科学
计算机科学

朱完元

月刊

1002-137X

jsjkx12@163.com

023-63500828

401121

重庆市渝北区洪湖西路18号

计算机科学/Journal Computer ScienceCSCD北大核心CSTPCD
查看更多>>本刊的读者对象是:大专院校师生,从事计算机科学与技术领域的科研、生产人员。办刊宗旨是:坚持“双百”方针,活跃计算机科学与技术领域的学术气氛,重点报导国内外计算机科学与技术的发展动态,为我国的计算机科学与技术立于世界之林、达到国际先进水平奋斗而矢志不渝。
正式出版
收录年代

    基于改进TF-IDF与BERT的领域情感词典构建方法

    蒋昊达赵春蕾陈瀚王春东...
    150-158页
    查看更多>>摘要:领域情感词典的构建是领域文本情感分析的基础.现有的领域情感词典构建方法存在所筛选候选情感词冗余度高、情感极性判断失准、领域依赖性强等问题.为了提高所筛选候选情感词的领域性和判断领域情感词极性的准确程度,提出了一种基于改进词频-逆文档频率(TF-IDF)与BERT的领域情感词典构建方法.该方法在筛选领域候选情感词阶段对TF-IDF算法进行改进,将隐含狄利克雷分布(LDA)算法与改进后的TF-IDF算法结合,进行领域性修正,提升了所筛选候选情感词的领域性;在候选情感词极性判断阶段,将情感倾向点互信息算法(SO-PMI)与BERT结合,利用领域情感词微调BERT分类模型,提高了判断领域候选情感词情感极性的准确程度.在不同领域的用户评论数据集上进行实验,结果表明,该方法可以提高所构建领域情感词典的质量,使用该方法构建的领域情感词典用于汽车领域和手机领域文本情感分析的F1值分别达到78.02%和88.35%.

    情感分析领域情感词典词频-逆文档频率隐含狄利克雷分布情感倾向点互信息算法BERT模型

    融合主题特征的文本情感分析模型

    杨俊哲宋莹陈逸菲
    159-166页
    查看更多>>摘要:随着大型语言模型的快速发展,如何在保证模型性能的同时减少模型参数量,成为了自然语言处理领的一个重要挑战.然而,现有的参数压缩技术往往难以兼顾模型的稳定性和泛化能力.为此,提出了一种融合主题特征的情感分析新架构,旨在利用主题信息增强模型对文本情感极性的判断能力.具体而言,采用一种结合LDA和K-means的方法来提取文本的主题特征,并将其作为固定维度的向量与词嵌入进行拼接,得到新的词向量表示.随后使用平均池化技术构建句子级别的表征向量,并输入到一个全连接层进行情感分类.为了验证所提模型的有效性,在公开的情感分析数据集上与多个基准算法进行了对比实验.实验结果表明,所提模型在多个数据集上明显优于ALBERT,准确率提高了约3.5%,在参数量仅有微小增加的情况下维持了较高的稳定性和泛化能力.

    情感分析ALBERT模型LDA模型主题特征平均池化

    远程模板检测算法及其在蛋白质结构预测中的应用

    梁方徐旭瑶赵凯龙赵炫锋...
    167-173页
    查看更多>>摘要:在从传统力场驱动的蛋白质结构预测到当前数据驱动的AI结构建模的发展历程中,蛋白质结构模板检测是蛋白质结构预测中的关键环节,如何检测高精度蛋白质结构远程模板对提升结构的预测精度具有重要的研究意义.该研究提出了一种基于自适应特征向量提取的远程同源模板检测算法ASEalign.首先,采用多特征信息融合的深度学习技术预测蛋白质接触图;然后,设计了融合接触图、二级结构、序列谱谱比对和溶剂可及性等多维度特征打分函数,并通过自适应地提取接触图矩阵中的特征值和特征向量进行模板比对;最后,将检测出的高质量模板输入AlphaFold2中进行结构建模.在135个蛋白质的测试集上的结果表明,ASEalign相于主流的模板检测算法HHsearch精度提升了11.5%;同时,结构建模的精度优于Al-phaFold2.

    模板检测模板建模接触图预测深度学习二级结构

    结合预训练的多文档摘要研究

    丁一王中卿
    174-181页
    查看更多>>摘要:新闻文本摘要任务旨在从庞大复杂的新闻文本中快速准确地提炼出简明扼要的摘要.基于预训练语言模型对多文档摘要进行研究,重点研究结合预训练任务的具体模型训练方式对模型效果提升的作用,强化多文档之间的信息交流,以生成更全面、更简练的摘要.对于结合预训练任务,提出对基线模型、预训练任务内容、预训练任务数量、预训练任务顺序的对比实验,探索标记了行之有效的预训练任务,总结归纳了强化多文档之间的信息交流的具体方法,精炼提出了简明高效的预训练流程.在公开新闻多文档数据集上进行训练和测试,实验结果表明预训练任务的内容、数量、顺序对ROUGE值都有一定提升,并且整合三者结论提出的特定预训练组合对ROUGE值有明显提升.

    新闻摘要预训练多文档信息交流

    基于集成学习的跨语言文本主题发现方法研究

    李帅于娟巫邵诚
    182-189页
    查看更多>>摘要:跨语言文本主题发现是跨语言文本挖掘领域的重要研究方向,对跨语言文本分析和组织各种文本数据具有较高的应用价值.基于Bagging和跨语言词嵌入改进LDA主题模型,提出跨语言文本主题发现方法BCL-LDA(Bagging,Cross-lingual word embedding with LDA),从多语言文本中挖掘关键信息.该方法首先将Bagging集成学习思想与LDA主题模型结合生成混合语言子主题集;然后利用跨语言词嵌入和K-means算法对混合子主题进行聚类分组;最后使用TF-IDF算法对主题词进行过滤排序.汉语-德语、汉语-法语主题发现实验表明,该方法在主题连贯性和多样性方面均表现优异,能够提取出语义更加相关且主题更加连贯多样的双语主题.

    主题发现跨语言LDA主题聚类德语法语

    路径规划问题的多策略改进樽海鞘群算法研究

    赵宏伟董昌林丁兵如柴海龙...
    190-198页
    查看更多>>摘要:针对移动机器人寻找最优路径问题,提出了一种融合无标度网络、自适应权重和黄金正弦算法变异策略的樽海鞘群算法 BAGSSA(Adaptive Salp Swarm Algorithm with Scale-free of BA Network and Golden Sine).首先,生成一个无标度网络来映射跟随者的关系,增强算法全局寻优的能力,在追随者进化过程中集成自适应权重ω,以实现算法探索和开发的平衡;同时选用黄金正弦算法变异进一步提高解的精度.其次,对12个基准函数进行仿真求解,实验数据表明平均值、标准差、Wilcoxon检验和收敛曲线均优于基本樽海鞘群和其他群体智能算法,证明了所提算法具有较高的寻优精度和收敛速度.最后,将BAGSSA应用于移动机器人路径规划问题中,并在两种测试环境中进行仿真实验,仿真结果表明,改进樽海鞘群算法较其他算法所寻路径更优,并具有一定理论与实际应用价值.

    樽海鞘群算法无标度网络自适应权重黄金正弦算法路径规划

    基于注意力机制和提示学习联合训练的上下位关系识别研究

    白宇王新哲
    199-203页
    查看更多>>摘要:专利术语间的上下位关系是一种重要的语义关系,专利文本中术语间的上下位关系识别在专利检索、查询扩展、知识图谱构建等多个领域发挥着重要作用.然而,专利文本领域的多样性、语言表述的复杂性使得术语间的上下位关系识别仍然面临许多挑战.文中提出一种融合提示学习和注意力机制的术语上下位关系识别方法,该方法基于远程监督框架,将术语之间的最短依存路径作为辅助特征融入提示模板,使用图神经网络将术语间的共现信息融入提示学习和注意力机制联合训练过程.在专利文本测试数据集上的实验结果表明,所提方法的AUC值、F1值达到94.94%和89.33%,相较于PARE模型分别提升了3.82%和3.17%.该方法有效地去除了使用远程监督方法标注的数据集的噪声,避免了掩码语言模型的训练目标和下游任务的不匹配问题,充分利用了预训练语言模型中存在的语言知识信息.

    术语关系识别远程监督提示学习注意力机制上下位关系

    融合证据句子提取的文档级关系抽取

    安先跨肖蓉杨肖
    204-209页
    查看更多>>摘要:文档级关系抽取作为自然语言处理领域的一个关键任务,旨在从长文档中准确抽取实体对之间的语义关系.传统的文档级关系抽取方法通常将整个文档作为输入,但事实上,人类只需根据文档中的部分句子即可预测实体对的关系,即证据句子.在现有研究中,很多研究方法都利用了证据句子,但是都存在无法找全以及很难充分利用这些证据句子的优势等问题.针对该问题,引入更加高效且准确的证据句子选取方法,通过融合公式法和删句法的证据句子提取策略,并将证据提取与训练推理过程相融合,使得文档级关系抽取模型更加关注重要的句子,同时仍可以识别文档中的完整信息.实验表明,改进后的模型在公共数据集上的表现优于已有模型.

    文档级关系抽取证据句子双线性层

    基于图卷积和注意力神经网络的旅行商问题新解法

    韦念念韩曙光
    210-217页
    查看更多>>摘要:旅行商问题是一个经典的组合优化问题.为快速求解旅行商问题,设计了由图嵌入网络、图卷积神经网络、注意力神经网络和多层感知机组合而成的深度学习模型的学习分支规则,通过改进传统的分支定界算法提高算法性能.对15个城市的旅行商问题实例进行监督训练,并在SCIP求解器上分别测试10,15,20,25和30个城市的旅行商问题实例.发现:基于学习分支规则的分支定界算法的求解时间比基于传统分支规则的分支定界算法的求解时间分别快-0.0022s,0.0178s,1.7643s,2.3074s和2.053 8s.因此,基于图神经网络的分支变量选择对传统分支规则的改进是有效的,可以较好地泛化到训练规模更大的旅行商问题实例中.

    旅行商问题图卷积神经网络注意力网络分支定界算法监督学习

    图片模糊集的一种相似度量及其在模式识别中的应用

    高建雷罗敏霞
    218-222页
    查看更多>>摘要:图片模糊集能刻画具有模糊性、不确定性和不一致性的信息,相似度量是刻画两个对象的相似程度.文中研究图片模糊集的相似度量.考虑图片模糊集3个隶属度的信息差,基于指数函数构造出一种新的相似度量.文中提出的相似度量不仅满足相似度量的公理化定义,并且在实际应用中得到合理的计算结果.将相似度量应用到模式识别中,与现存的一些相似度量进行对比分析,结果表明所提出的相似度量不仅可以弥补一些现存相似度量的缺陷,还可以得到合理的计算结果.

    图片模糊集相似度量模式识别