首页|一种基于词汇链的关键词抽取方法

一种基于词汇链的关键词抽取方法

A Keyword Selection Method Based on Lexical Chains

扫码查看
关键词在文献检索、自动文摘、文本聚类/分类等方面有十分重要的作用.词汇链是由一系列词义相关的词语组成,最初被用于分析文本的结构.本文提出了利用词汇链进行中文文本关键词自动标引的方法,并给出了利用<知网>为知识库构建词汇链的算法.通过计算词义相似度首先构建词汇链,然后结合词频与区域特征进行关键词选择.该方法考虑了词汇之间的语义信息,能够改善关键词标引的性能.实验结果表明,与单纯的词频、区域方法相比,召回率提高了7.78%,准确率提高了9.33%.

索红光、刘玉树、曹淑英

展开 >

北京理工大学,计算机科学技术学院,北京,100081

中国石油大学,计算机与通信工程学院,山东,东营,257061

计算机应用 中文信息处理 关键词标引 关键词抽取 词汇链 词义相似度 知网

国家自然科学基金

60503050

2006

中文信息学报
中国中文信息学会,中国科学院软件研究所

中文信息学报

CSTPCDCSCDCHSSCD北大核心
影响因子:0.8
ISSN:1003-0077
年,卷(期):2006.20(6)
  • 82
  • 4