首页|基于事件抽取的金融知识图谱构建与应用

基于事件抽取的金融知识图谱构建与应用

王丽媛

基于事件抽取的金融知识图谱构建与应用

王丽媛1
扫码查看

作者信息

  • 1. 中国科学院大学
  • 折叠

摘要

随着互联网技术的蓬勃发展,互联网已经成为各行各业信息发布、传播和获取的主要途径。当前金融行业中,数据来源众多、数据类型繁杂、数据量庞大,且数据间关联复杂,在这种情况下,传统的数据库和关系型的数据组织形式已经难以满足数据分析和业务发展的需求,因此建立较为完备的金融知识图谱系统非常有必要。金融知识图谱的建立可以将金融领域的各种知识和数据进行整合,从而提高金融数据的管理和利用效率,有助于实现金融风险的预测和防范。因此,金融知识图谱的研究具有重要的理论和实践意义。本文围绕金融知识图谱为中心,开展了以下工作: (1)就知识图谱的构建方面,本文选取了文档级事件抽取问题作为研究对象,事件抽取是知识图谱的关键构建技术之一。首先,本文使用序列标注模型识别实体类型,并使用编码层捕捉实体的上下文信息,为事件论元抽取提供更多信息。其次,使用针对迭代式事件论元抽取带来的误差累积问题,本文设计了结合层次注意力机制的查询表事件抽取算法。该方法使用查询表机制,将论元抽取转化为填表问题,并发地抽取同一个事件中全部的事件论元。最后,在ChFinAnn和DuEE-fin两个金融文本事件抽取数据集上进行实验,分别获得了2.2%和2.4%的F1值提升,验证了该方法的有效性。 (2)就知识图谱的应用方面,本文选取了简单知识问答开展研究,问答系统作为一种高级交互形式,是知识图谱的典型应用。首先,为了提高实体和关系链接的准确性,本文提出了实体关系联合链接的方法,通过类似孪生网络的架构对问句的文本编码和实体关系二元组的图嵌入编码进行相似度计算。其次,在答案匹配环节,将基于实体关系预测的路径推理过程和直接的答案匹配结合在一起,综合排序候选答案。最后,在SimpleQuestions和本项目构建的数据集FinQuestions上进行了实验验证,分别获得了2%和3.8%的准确率提升。 (3)在前两点的基础上,本文构建了包含A股、行业板块、概念板块和股票事件等的金融知识图谱系统。在由结构化数据构建的静态图谱的基础上,通过事件抽取模块构建动态添加丰富的事件信息,以增强金融实体之间的联系,提高风险预测的准确性。在金融知识图谱的基础上,实现了一个简单的问答系统,以提升金融知识图谱系统的自动化程度和数据利用效率。

关键词

知识图谱/信息抽取/事件抽取/知识问答

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

宋新波

学位年度

2023

学位授予单位

中国科学院大学

语种

中文

中图分类号

TP
段落导航相关论文