首页|融合信息熵的TextRank关键词抽取方法

融合信息熵的TextRank关键词抽取方法

扫码查看
将信息熵融入TextRank算法中分词器部分以改善关键词抽取的准确度.在分词前,先用信息熵的方式提取文章的关键新词,加入到分词字典中,使分词器能够自主识别新词,以增强文章关键词提取的准确性.当语料中存在新词的时候,关键词抽取准确度效果提升明显,对不存在新词的语料关键词抽取准确度无明显提升.改善分词效果可以提升关键词抽取准确度.
TextRank Keyword Extraction Method Based on Information Entropy

于腊梅、杨良斌

展开 >

国际关系学院信息科技学院 北京 100091

抽取 信息熵 TextRank

国家安全高精尖学科建设科研专项学校项目

2019GA37

2022

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2022.50(3)
  • 1
  • 10