计算机技术与发展2022,Vol.32Issue(9) :188-192.DOI:10.3969/j.issn.1673-629X.2022.09.029

基于岩石文本信息的命名实体识别

Named Entity Recognition Based on Rock Text Information

杜睿山 陈思路 刘文豪
计算机技术与发展2022,Vol.32Issue(9) :188-192.DOI:10.3969/j.issn.1673-629X.2022.09.029

基于岩石文本信息的命名实体识别

Named Entity Recognition Based on Rock Text Information

杜睿山 1陈思路 1刘文豪1
扫码查看

作者信息

  • 1. 东北石油大学 计算机与信息技术学院,黑龙江 大庆 163318
  • 折叠

摘要

命名实体识别技术是自然语言处理领域的重要任务之一.但岩石文本信息中的命名实体存在边界不清、分词困难、误差传播、计算效率慢等问题.基于岩石文本信息进行知识抽取对油气勘探领域的研究具有重大意义.为此,该文首先构建岩石文本数据集,并提出Lexicon-BiLSTM-CRF网络模型应用于非结构化的岩石文本上,该模型首先经过Lexicon机制获得每个字符的所有匹配词,从而解决了边界不清、分词困难的问题,在此基础上提升了计算效率.然后通过双向长短期记忆网络(BiLSTM)提取上下文语义特征,将语义向量传入条件随机场(CRF)层并采用维特比算法解码,降低了错误标签的输出概率并预测实体标注标签,最终实现岩石文本的命名实体抽取任务.在构建的岩石文本数据集的基础上进行几组对比实验,验证了该方法在准确率和召回率上具有一定提升.

关键词

命名实体识别/Lexicon/岩石/非结构化文本/条件随机场/知识抽取

引用本文复制引用

基金项目

出版年

2022
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
参考文献量8
段落导航相关论文