首页|新疆馆藏地质资料知识图谱构建

新疆馆藏地质资料知识图谱构建

扫码查看
为进一步提升新疆自然资源档案馆地质资料信息集成利用率,打破目前查借阅档案仅限于目录查找方式的现状,引入知识图谱对新疆馆藏地质资料进行优化管理.以3 108档馆藏地质资料为数据源,通过本体构建确定实体和关系;基于BIO序列标注对新疆馆藏地质资料数据进行人工标注;采用BERT-BiLSTM-CRF模型完成知识抽取,并选用图数据库Neo4j存储新疆馆藏地质资料知识,完成新疆馆藏地质资料知识图谱的构建.实验结果表明,BERT-BiLSTM-CRF模型的准确率为98.177 7%、F1值为97.892 1%,能准确识别出新疆馆藏地质资料中的地质实体.新疆馆藏地质资料知识图谱的构建为新疆自然资源档案馆的"数字档案馆"建设及新疆地质资料大数据社会化服务水平的提升奠定基础.
Construction of Knowledge Graph for Geological Data in Xinjiang Collection
To further enhance the integrated utilization of geological data information in the Xinjiang Natural Resourc-es Archives and break the current limitation of archival retrieval only through catalog search,a knowledge graph is intro-duced to optimize the management of geological materials in the Xinjiang Archives.Partial geological materials in the ar-chives are used as the data source,and entities and relationships are determined through ontology construction.The Xinji-ang geological materials data is manually annotated using a BIO sequence labeling method.The BERT-BiLSTM-CRF model is employed for knowledge extraction,and the Neo4j graph database is used to store the knowledge of Xinjiang geological materials,completing the construction of the Xinjiang Geological Materials Knowledge Graph.Experimental results show that the BERT-BiLSTM-CRF model achieves an accuracy rate of 98.1777%and an F1 score of 97.8921%,significantly outperforming the BERT-CRF,BERT-IDCNN-CRF,and BERT-BiGRU-CRF models.The construction of the Xin-jiang Geological Materials Knowledge Graph can provide a foundation for the development of a"Digital Archives"in the Xinjiang Natural Resources Archives and enhance the socialization of Xinjiang geological data big data services.

Knowledge graphGeological informationKnowledge extractionGraph database

刘潇潇、孟小艳、李东亚、魏建新、阿依谢姆古丽·阿卜杜艾尼、付钰、朱彦菲

展开 >

新疆农业大学计算机与信息工程学院,新疆乌鲁木齐 830052

新疆维吾尔自治区自然资源信息中心(新疆维吾尔自治区自然资源档案馆)新疆 乌鲁木齐 830002

新疆激光雷达应用工程技术研究中心,新疆 乌鲁木齐 830002

青岛科技大学信息科学技术学院,山东青岛 266061

新疆维吾尔自治区地质调查院,新疆乌鲁木齐 830000

展开 >

知识图谱 地质资料 知识抽取 图数据库

新疆维吾尔自治区地质资料智能服务系统项目

2024

新疆地质
新疆维吾尔自治区地质学会

新疆地质

CSTPCD
影响因子:0.879
ISSN:1000-8845
年,卷(期):2024.42(1)
  • 13