首页|基于改进TextRank的铁路文献关键词抽取算法

基于改进TextRank的铁路文献关键词抽取算法

扫码查看
实现铁路行业海量的铁路科技信息资源有效地组织管理并提供智能化、专业化的检索和服务,已经成为科研人员迫切期望解决的问题.关键词自动抽取技术是实现信息的智能检索和标引分类的核心技术,本文提出了一种改进TextRank的关键词抽取算法应用于铁路文献关键词的抽取,该算法融合多个特征因素改进词汇节点的初始权重设置,并利用Word2Vec训练的词向量表征改进词节点间的转移概率.实验结果表明:本文所提出的关键词抽取算法相对于经典的TextRank和TF-IDF算法在准确率,召回率以及F值上都有较大的提升.与TextRank相比,F值提升了13.9%.
Keywords extraction algorithm of railway literature based on improved TextRank

赵占芳、刘鹏鹏、李雪山

展开 >

河北地质大学信息工程学院,石家庄050031

河北省光电信息与地球探测技术重点实验室,石家庄050031

中国铁道科学研究院科学技术信息研究所,北京100081

抽取 Word2Vec模型 TextRank算法

中国铁道科学研究院基金中国工程院项目

2018YJ134CKCEST-2019-2-11

2021

北京交通大学学报
北京交通大学

北京交通大学学报

CSTPCDCSCD北大核心
影响因子:0.525
ISSN:1673-0291
年,卷(期):2021.45(2)
  • 13
  • 8