首页|基于多任务联合训练的法律文本机器阅读理解模型

基于多任务联合训练的法律文本机器阅读理解模型

扫码查看
随着裁判文书等司法大数据不断积累,如何将人工智能与法律相结合成为了法律智能研究的热点。该文针对2020中国法研杯司法人工智能挑战赛(CAIL2020)的机器阅读理解任务,提出了一种基于多任务联合训练的机器阅读理解模型。该模型将阅读理解任务划分为四个子模块:文本编码模块、答案抽取模块、答案分类模块和支持句子判别模块。此外,该文提出了一种基于TF-IDF的"问题-文章句子"相似度匹配的数据增强方法。该方法对中国法研杯2019的训练集进行重新标注,实现数据增强。通过以上方法,最终该集成模型在2020中国法研杯机器阅读理解任务中联合F1值为74。49,取得全国第一名。
A Reading Comprehension Model for Judical Texts Based on Multi Task Joint Training

李芳芳、任星凯、毛星亮、林中尧、刘熙尧

展开 >

中南大学 计算机学院,湖南 长沙 410083

移动医疗教育部-中国移动联合重点实验室,湖南 长沙 410028

湖南工商大学 大数据与互联网创新研究院,湖南 长沙 410205

中国法研杯 机器阅读理解 多任务联合训练

2020YFC08327007179061561421011903022020JJ4746Kq2014134

2021

中文信息学报
中国中文信息学会,中国科学院软件研究所

中文信息学报

CSTPCDCSCDCHSSCD北大核心
影响因子:0.8
ISSN:1003-0077
年,卷(期):2021.35(7)
  • 3
  • 31