NSTL
万方数据
一种融合主题信息的司法舆情文本摘要方法
黄于欣 1于志强 郭军军 线岩团 余正涛 相艳
作者信息
摘要
本发明涉及融合主题信息的司法舆情文本摘要方法。本发明首先构造司法舆情文本摘要数据集;利用主题模型生成包含主题词和文档主题概率分布的司法舆情主题知识库;再在基于注意力的编解码模型基础上,提出一种基于主题信息约束的司法舆情文本摘要模型。一方面对主题词编码获得新闻文本相关的主题向量,将其作为外部知识融入解码过程中指导摘要生成;另一方面计算得到已生成摘要的主题分布,利用预训练的新闻文本主题分布优化模型。本发明利用主题信息作为外部知识,更有效的指导解码过程,生成质量更高的文本摘要,为开展融入领域知识的司法舆情文本摘要研究提供了可借鉴的方法,同时也为及时、有效、快速的司法舆情应急处置提供强有力的支撑。
申请号
CN201910999268.3公开号
CN110909152B专利类型
发明专利申请日
2019-10-21公开日
2021-07-09IPC分类
G06F16/34(2019.01)申请人
昆明理工大学发明人
黄于欣/于志强/郭军军/线岩团/余正涛/相艳主申请人地址
650093 云南省昆明市五华区学府路253号国别省市代码
中国(CN)