首页|基于集成学习的文本摘要抽取方法研究

基于集成学习的文本摘要抽取方法研究

扫码查看
为提高中文文本摘要抽取的准确性与应用于不同类型文本的有效性,论文结合MMR算法、TextRank算法、文本主题以及篇章结构信息,提出一种基于集成学习的无监督中文文本摘要自动抽取模型.使用每种抽取方法单独抽取关键句,然后采用投票机制对各方法抽取出的句子进行加权投票,对多种方法共同抽取出的句子赋予更高的权重.实验结果表明,该模型应对不同结构文本泛化能力更强,在抽取单句摘要时Rouge_1得分要高于最优的单一抽取算法得分,Rouge_2、Rouge_L得分接近最优结果;在抽取多句摘要时Rouge_1、Rouge_2、Rouge_L得分要高于其他单一方法,比最优的单一抽取算法分别提高了1.7个、1.3个、1.5个百分点,相比传统摘要抽取算法提取的摘要质量更高.
Research of Text Summarization Extractive Method Based on Ensemble Learning

祝超群、彭艳兵

展开 >

武汉邮电科学研究院 武汉 430070

南京烽火天地通信科技有限公司 南京 210019

集成学习 摘要抽取 无监督

国家重点研发计划

2017YFB1400704

2022

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2022.50(7)
  • 1
  • 5