首页|融合标签信息的裁判文书证据抽取方法研究

融合标签信息的裁判文书证据抽取方法研究

扫码查看
针对信息抽取中,序列标注模型很难捕获句子的长距离语义而导致输入特征使用不充分,使得在裁判文书中的证据实体抽取上性能较差的问题,提出一种融合标签信息的裁判文书证据抽取方法.首先,将数据的序列标注格式转换为融合标签信息的机器阅读理解格式的三元组;其次,将文本信息与标签信息融合送入BERT预训练模型;最后,设定阈值,通过MLP输出预测的证据实体索引.实验结果表明:在2293篇裁判文书数据集上,论文提出的方法相较于传统序列标注模型,在F1值上提高了1.93%.
Research on Judgment Document Evidence Extraction Method Combined with Label Information

周裕林、鹿安琪、周雯童、刘林红

展开 >

公共大数据国家重点实验室 贵阳 550025

贵州大学计算机科学与技术学院 贵阳 550025

标签信息 裁判文书 机器阅读理解 证据抽取

贵大省创字2021055

2022

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2022.50(9)
  • 1