计算机科学2021,Vol.48Issue(12) :331-336.DOI:10.11896/jsjkx.210500028

面向法律裁判文书的生成式自动摘要模型

Abstractive Automatic Summarizing Model for Legal Judgment Documents

周蔚 王兆毓 魏斌
计算机科学2021,Vol.48Issue(12) :331-336.DOI:10.11896/jsjkx.210500028

面向法律裁判文书的生成式自动摘要模型

Abstractive Automatic Summarizing Model for Legal Judgment Documents

周蔚 1王兆毓 1魏斌2
扫码查看

作者信息

  • 1. 中国政法大学法治信息管理学院 北京 102249
  • 2. 浙江大学数字法治研究院 杭州 310008
  • 折叠

摘要

当前面向中文内容的自动摘要模型应用于法律裁判文书时,主要采用抽取式方法进行摘要.但由于法律文本比较冗长、结构化程度较低,抽取式摘要的精准度和可靠性有所欠缺.为了获得法律裁判文书的高质量文本摘要,文中提出了一种生成式多模型融合的自动摘要方法.在Seq2Seq模型的基础上,引入注意力(attention)机制,同时通过Bert预训练和强化学习等方法,结合选择门技术,提出了BASR(Bert Based Attention Seq2Seq Reinforced Model)模型.将50000篇法律裁判文书作为语料,以小额诉讼和简易程序类型的裁判文书为代表性研究对象,实验结果证明新模型有较好的效果,在ROUGE评价中相比传统的Seq2Seq+Attention模型取得了均值5.81%的性能提升.

关键词

裁判文书/自动摘要/模型融合/Seq2/Seq/注意力机制/强化学习

引用本文复制引用

基金项目

中国政法大学科研创新项目(21ZFQ82005)

浙江省重点研发计划(2020C01060)

国家重点研发计划(2018YFC0831800)

国家社科基金重大项目(20&ZD047)

中央高校基本科研业务费专项()

出版年

2021
计算机科学
重庆西南信息有限公司(原科技部西南信息中心)

计算机科学

CSTPCDCSCD北大核心
影响因子:0.944
ISSN:1002-137X
被引量5
参考文献量7
段落导航相关论文