计算机技术与发展2020,Vol.30Issue(8) :97-102.DOI:10.3969/j.issn.1673-629X.2020.08.016

GSGD:一种基于BERT与本体推理的自动分级系统

An Automatic Grading System Based on BERT and Ontology Reasoning

王珊珊 邹佳 程序 刘汪洋 蔡惠民
计算机技术与发展2020,Vol.30Issue(8) :97-102.DOI:10.3969/j.issn.1673-629X.2020.08.016

GSGD:一种基于BERT与本体推理的自动分级系统

An Automatic Grading System Based on BERT and Ontology Reasoning

王珊珊 1邹佳 1程序 1刘汪洋 1蔡惠民1
扫码查看

作者信息

  • 1. 中电科大数据研究院有限公司,贵州 贵阳 550022;提升政府治理能力大数据应用技术国家工程实验室,贵州 贵阳 550022
  • 折叠

摘要

政府数据资源分级管理是政府数据共享开放和数据治理的关键性工作.由于数据资源规模大,分级体系不完善,工具缺乏,使得该工作多由人工进行,导致支撑依据不足、主观性强、精确性差、成效不足.文中设计并实现了基于政策法规、典型案例的政府数据自动分级系统—GSGD(grading system for government data).首先,利用政策法规以及典型案例构建本体库,根据分级目标以及构建的本体特性,构建自定义推理规则;再通过BERT获得输入数据与关键词的语义特征词/句向量,并计算向量之间的余弦相似度;最后对相似度较高的关键词,采用Jena对政策法规库以及典型案例库进行查询推理得到分级结果以及分级依据,以实现对政府数据的自动化分级,提高分级工作效率.通过实验对比分析,验证了该方法的有效性.

关键词

数据分级/政府数据/BERT/法律本体/余弦相似度

引用本文复制引用

基金项目

天津市新一代人工智能科技重大专项(18ZXZNGX00370)

出版年

2020
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
被引量2
参考文献量15
段落导航相关论文