计算机技术与发展2023,Vol.33Issue(5) :1-8.DOI:10.3969/j.issn.1673-629X.2023.05.001

抽取-生成式自动文本摘要技术研究综述

Review of Research on Extractive-abstractive Automatic Text Summarization Technology

刘迪 奚雪峰 崔志明 盛胜利
计算机技术与发展2023,Vol.33Issue(5) :1-8.DOI:10.3969/j.issn.1673-629X.2023.05.001

抽取-生成式自动文本摘要技术研究综述

Review of Research on Extractive-abstractive Automatic Text Summarization Technology

刘迪 1奚雪峰 2崔志明 3盛胜利4
扫码查看

作者信息

  • 1. 苏州科技大学 电子信息与工程学院,江苏 苏州 215000
  • 2. 苏州市虚拟现实智能交互及应用重点实验室,江苏 苏州 215000
  • 3. 苏州智慧城市研究院,江苏 苏州 215000
  • 4. 德州理工大学,得克萨斯州 拉伯克市 79401
  • 折叠

摘要

自动文本摘要技术是一项利用计算机按照某类应用自动地将文本或文本集合转换成简短摘要的信息压缩技术.在当前互联网的快速发展背景下,涌现出大量复杂的信息,导致人工无法精准捕捉有效的信息.为此,在本着更准确、更便捷、更高效地收集信息为目的的前提下,利用自然语言处理中自动文本摘要技术处理复杂文本的优势将显得格外突出.随着抽取式摘要技术和生成式摘要技术的发展成熟,抽取-生成式摘要技术逐渐兴起.以技术分析为干线,对抽取-生成式摘要技术进行综述.首先,介绍了抽取-生成式摘要技术中的评价方法以及常用中英文数据集;其次,通过实例分析六类主流技术方法并对比其优缺点:基于强化学习的方法、基于信息论的方法、基于指针网络的方法、基于序列标注的方法、基于预训练的方法、基于联合注意力的方法;最后,总结了抽取-生成式摘要技术面临的挑战并展望了抽取-生成式摘要技术未来的发展方向.

关键词

自然语言处理/自动文本摘要/抽取-生成式/评价方法/数据集

引用本文复制引用

基金项目

国家自然科学基金(61876217)

国家自然科学基金(62176175)

江苏省"六大人才高峰"高层次人才项目(XYDXX-086)

出版年

2023
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
被引量1
参考文献量4
段落导航相关论文