计算机应用研究2021,Vol.38Issue(1) :129-133.DOI:10.19734/j.issn.1001-3695.2019.09.0590

融合主题特征的文本自动摘要方法研究

Research on automatic text summarization combining topic feature

罗芳 汪竞航 何道森 蒲秋梅
计算机应用研究2021,Vol.38Issue(1) :129-133.DOI:10.19734/j.issn.1001-3695.2019.09.0590

融合主题特征的文本自动摘要方法研究

Research on automatic text summarization combining topic feature

罗芳 1汪竞航 1何道森 2蒲秋梅3
扫码查看

作者信息

  • 1. 武汉理工大学计算机科学与技术学院,武汉430063
  • 2. 香港恒生大学供应链及资讯管理系,香港999077
  • 3. 中央民族大学信息工程学院,北京100081
  • 折叠

摘要

针对传统图模型方法进行文本摘要时只考虑统计特征或浅层次语义特征,缺乏对深层次主题语义特征的挖掘与利用,提出了融合主题特征后多维度度量的文本自动摘要方法MDSR(multi-dimension summarization rank).首先利用LDA主题模型对文本主题语义信息进行挖掘,定义了主题重要度以衡量主题特征对句子重要程度的影响;然后结合主题特征、统计特征和句间相似度,改进了图模型节点的概率转移矩阵的构建方式;最后根据句子节点权重进行摘要的抽取与度量.实验结果显示,当主题特征、统计特征及句间相似度权重比例达到3:4:3时,MDSR方法的ROUGE评测值达到最佳,ROUGE-1﹑ROUGE-2﹑ROUGE-SU4值分别达到53.35%﹑35.18%和33.86%,优于对比方法,表明了融入主题特征后的文本摘要方法有效提高了摘要抽取的准确性.

关键词

TextRank/文本摘要/语义特征/主题模型/概率转移矩阵

引用本文复制引用

基金项目

国家教育部人文社会科学研究规划基金资助项目(18YJAZH087)

武汉理工大学自主创新研究基金资助项目(3120600100)

出版年

2021
计算机应用研究
四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心
影响因子:0.93
ISSN:1001-3695
被引量4
参考文献量10
段落导航相关论文