摘要
自动文本摘要技术是一项利用计算机按照某类应用自动地将文本或文本集合转换成简短摘要的信息压缩技术.在当前互联网的快速发展背景下,涌现出大量复杂的信息,导致人工无法精准捕捉有效的信息.为此,在本着更准确、更便捷、更高效地收集信息为目的的前提下,利用自然语言处理中自动文本摘要技术处理复杂文本的优势将显得格外突出.随着抽取式摘要技术和生成式摘要技术的发展成熟,抽取-生成式摘要技术逐渐兴起.以技术分析为干线,对抽取-生成式摘要技术进行综述.首先,介绍了抽取-生成式摘要技术中的评价方法以及常用中英文数据集;其次,通过实例分析六类主流技术方法并对比其优缺点:基于强化学习的方法、基于信息论的方法、基于指针网络的方法、基于序列标注的方法、基于预训练的方法、基于联合注意力的方法;最后,总结了抽取-生成式摘要技术面临的挑战并展望了抽取-生成式摘要技术未来的发展方向.
基金项目
国家自然科学基金(61876217)
国家自然科学基金(62176175)
江苏省"六大人才高峰"高层次人才项目(XYDXX-086)