计算机技术与发展2020,Vol.30Issue(11) :25-29.DOI:10.3969/j.issn.1673-629X.2020.11.005

一种基于改进ELMO模型的组织机构名识别方法

An Organization Name Recognition Method Based on Improved ELMO Model

胡万亭 郭建英 张继永
计算机技术与发展2020,Vol.30Issue(11) :25-29.DOI:10.3969/j.issn.1673-629X.2020.11.005

一种基于改进ELMO模型的组织机构名识别方法

An Organization Name Recognition Method Based on Improved ELMO Model

胡万亭 1郭建英 1张继永2
扫码查看

作者信息

  • 1. 河南大学 濮阳工学院,河南 濮阳 457000
  • 2. 西南交通大学 信息科学与技术学院,四川 成都 610000
  • 折叠

摘要

组织机构名识别是命名实体识别的核心任务之一,也是最困难的任务.近年来,预训练模型在中文自然语言处理领域得到广泛应用,预训练的词嵌入模型在中文命名实体识别上取得了非常好的效果,但是在组织机构名识别上还有很大的提升空间.针对这一问题,改进ELMO(embedding from language models)预训练模型,结合双向LSTM神经网络模型和条件随机场模型,去识别组织机构名.对于ELMO的改进,主要通过筛选高频机构词,然后将高频机构词加入中文字典,通过ELMO模型训练生成机构词向量和普通字向量.字向量不用考虑未登录词的问题,机构词向量引入了先验知识,结合起来可以使得生成的字词向量能够更好地表征组织机构名.实验结果表明,预训练模型的数据集相对较小时,该方法比字向量嵌入的方法有更好的效果,F1值提高了1.3%.

关键词

ELMO模型/LSTM模型/机构词/条件随机场/组织机构名识别

引用本文复制引用

基金项目

河南省高校重点科研项目(18B510014)

出版年

2020
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
参考文献量9
段落导航相关论文