首页|一种基于聚类的文章自动摘要方法及实现

一种基于聚类的文章自动摘要方法及实现

扫码查看
本文提出一种基于聚类的自动摘要方法,该方法将文章中所有句子转换为句子向量,并且使用基于AGNES的算法对删除离群点后的句子向量进行聚类,形成多个句子向量个数不超过设定阈值的簇,删除句子向量个数极少的“无用”簇后,从每个簇中挑选出最能代表簇的语义的一个或者两个句子,根据每个句子到语义中心的距离等信息从小到大确定指定数量的几个句子作为关键句,拼接成文章摘要.通过在中国科普博览网站上随机挑选的500篇科普文章上进行实验,上述方法各项指标均优于基于图模型的TextRank算法以及基于统计的方法,证明了该方法的有效性和可用性.
A Clustering-Based Method for Automatic Summarization of Articles and It's Implementation

唐建权、何洪波、王闰强

展开 >

中国科学院计算机网络信息中心,北京 100190

中国科学院大学,北京 100049

自动摘要 聚类 AGNES 簇的语义

中国科学院十三五信息化建设专项

XXH13504-04

2019

科研信息化技术与应用

科研信息化技术与应用

影响因子:0.364
ISSN:
年,卷(期):2019.10(1)
  • 12