融合标签信息的裁判文书证据抽取方法研究

扫码查看

原文链接

国家科技期刊平台
NETL
NSTL
万方数据
维普

中文摘要：针对信息抽取中,序列标注模型很难捕获句子的长距离语义而导致输入特征使用不充分,使得在裁判文书中的证据实体抽取上性能较差的问题,提出一种融合标签信息的裁判文书证据抽取方法.首先,将数据的序列标注格式转换为融合标签信息的机器阅读理解格式的三元组;其次,将文本信息与标签信息融合送入BERT预训练模型;最后,设定阈值,通过MLP输出预测的证据实体索引.实验结果表明:在2293篇裁判文书数据集上,论文提出的方法相较于传统序列标注模型,在F1值上提高了1.93％.

外文标题：Research on Judgment Document Evidence Extraction Method Combined with Label Information

作者：

周裕林、鹿安琪、周雯童、刘林红

展开 >

作者单位：

公共大数据国家重点实验室贵阳 550025

贵州大学计算机科学与技术学院贵阳 550025

关键词：

标签信息裁判文书机器阅读理解证据抽取

基金：

项目编号：

贵大省创字2021055

出版年：

2022

DOI：

10.3969/j.issn.1672-9722.2022.09.027

计算机与数字工程

中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD

影响因子：0.355

ISSN：1672-9722

年,卷(期)：2022.50(9)

参考文献量1