首页|基于知识图谱的纪检监察知识库构建技术研究

基于知识图谱的纪检监察知识库构建技术研究

郭威

基于知识图谱的纪检监察知识库构建技术研究

郭威1
扫码查看

作者信息

  • 1. 内蒙古科技大学
  • 折叠

摘要

纪检与监察是党的纪律检查机关和政府监察部门行使的两种职能,加强纪检监察建设是加强党的能力建设的必然要求。随着工作力度进一步加强,传统的信息存储方式逐渐难以满足工作人员处理信息的需求。纪检监察领域的保密性及专业性导致办案程序相对复杂、门槛较高。针对该领域通报数据数量多、关联性低、内容复杂、整理困难等问题,本文提出构建纪检监察知识图谱,并通过相似度算法将法律法条信息与历史案例融合,最终利用知识图谱内存在的实体与关系构建智能问答系统的技术流程。在坚持事实为上、科学定性量纪执法的要求下,构建图谱的重要意义在于利用所搭建的系统发现案件之间隐藏关系,并根据历史案件为实际反腐工作提供知识查阅与参考。 针对以上需求,首先,本文根据业务需求通过自底向上的方式确立包含多类实体与关系的模式层,构建纪检监察知识图谱。利用纪委监委网站信息以及相关报道收集了违法案例数据。在进行去除停用词、去除无关信息等预处理后,经过BIO标注形成违法案例数据集。对比多种深度学习模型在当前数据集命名实体识别任务上的准确性,确定利用BERT-BiLSTM-CRF模型完成实体抽取工作。将获取的实体与语义关系组成三元组并存入Neo4J图数据库中,实现知识图谱的可视化展示。其次,利用纪委监委相关部门提供的招投标数据以及公开的其他相关原始数据经过过滤清洗等操作,创建结构化数据表,根据数据表以及数据间关联设计模式层。将不同实体通过亲属、公司职位等关系连接,并存入图数据库中,实现利用招投标知识图谱推导违规行为的功能。再次,获取纪检领域法律法规数据,利用基于文本向量化表示的余弦距离算法、欧氏距离算法等相似度算法加权求和,根据匹配最高值将法律法条与知识图谱内违纪案例事实进行融合,满足参考历史案例定性量纪时有法可依的需求。最后,以知识图谱为信息来源,利用AC自动机快速匹配自然问句中的实体,利用实体及问句意图匹配经验模板,根据匹配最优解创建推理问题查询语句,从知识图谱内返回所需答案。 上述方法实现了从非结构化数据到知识图谱建立到利用图谱智能问答的全过程,通过结合历史案件等多源信息的知识图谱为纪检工作人员科学决策提供支持与帮助,同时为领域型知识图谱构建提供了技术参考。

关键词

知识图谱/命名实体识别/纪检监察/相似度计算/问答系统

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

刘月峰

学位年度

2022

学位授予单位

内蒙古科技大学

语种

中文

中图分类号

TP
段落导航相关论文