计算机科学2021,Vol.48Issue(10) :44-50.DOI:10.11896/jsjkx.200900082

一种基于图的文档关键词和摘要协同抽取方法研究

Graph Based Collaborative Extraction Method for Keywords and Summary from Documents

毛湘科 黄少滨 余秦勇
计算机科学2021,Vol.48Issue(10) :44-50.DOI:10.11896/jsjkx.200900082

一种基于图的文档关键词和摘要协同抽取方法研究

Graph Based Collaborative Extraction Method for Keywords and Summary from Documents

毛湘科 1黄少滨 2余秦勇3
扫码查看

作者信息

  • 1. 哈尔滨工程大学计算机科学与技术学院 哈尔滨 150001;中电科大数据研究院有限公司 贵阳 550022;提升政府治理能力大数据应用技术国家工程实验室 贵阳 550022
  • 2. 哈尔滨工程大学计算机科学与技术学院 哈尔滨 150001
  • 3. 中电科大数据研究院有限公司 贵阳 550022;提升政府治理能力大数据应用技术国家工程实验室 贵阳 550022
  • 折叠

摘要

关键词提取和摘要抽取的目的都是从原文档中选择关键内容并对原文档的主要意思进行概括.评价关键词和摘要抽取质量的好坏主要看其能否对文档的主题进行良好的覆盖.在现有基于图模型的关键词提取和摘要抽取方法中,很少涉及到将关键词提取和摘要抽取任务协同进行的,而文中提出了一种基于图模型的方法进行关键词提取和摘要的协同抽取.该方法首先利用文档中词、主题和句子之间的6种关系,包括词和词、主题和主题、句子和句子、词和主题、主题和句子、词和句子,进行图的构建;然后利用文档中词和句子的统计特征对图中各顶点的先验重要性进行评价;接着采用迭代的方式对词和句子进行打分;最后根据词和句子的得分,得到关键词和摘要.为验证所提方法的效果,文中在中英文数据集上进行关键词提取和摘要抽取实验,发现该方法不管是在关键词提取还是摘要抽取任务上都取得了良好的效果.

关键词

提取/摘要抽取/图模型/主题覆盖

引用本文复制引用

基金项目

出版年

2021
计算机科学
重庆西南信息有限公司(原科技部西南信息中心)

计算机科学

CSTPCDCSCD北大核心
影响因子:0.944
ISSN:1002-137X
被引量1
参考文献量30
段落导航相关论文