基于深度学习的中文命名实体识别技术研究

龚成¹

扫码查看

作者信息

1. 国防科技大学
折叠

摘要

随着互联网技术和信息技术的发展，传统的搜索方式逐渐被以知识图谱为支撑的搜索方式所代替，以知识图谱为支撑的搜索方式不仅能为用户提供更为精确的结果，而且还能提供其他相关联的知识点。作为构建知识图谱的重要基础工作，命名实体识别一直都是一个受关注度非常高的课题。相对英文上的命名实体研究而言，面向中文的实体抽取技术研究水平相对滞后，方法多是在面向英文的研究工作基础上，加入部分人工语言特征来实现实体的识别与抽取。这是因为与英文相比，中文存在一定的特殊性包括命名实体类型的多样性、天然分隔符的缺失以及中文名称常出现的一些嵌套现象，这些特殊性使得目前中文命名实体识别存在巨大的提升空间。本文以基于深度学习的中文命名实体识别为主要研究内容，对中文和外文的现有命名实体识别方法进行了研究，重点对深度学习命名实体识别技术进行了介绍，总结了目前中文命名实体识别的难点，本文引入了目前较为流行的深度学习序列标注模型—神经网络+CRF模型作为基准模型，并在此基础上进行了改进，使其更好的应用于中文命名实体识别任务中。首先，为了减弱模型对人工特征的依赖性，提高模型对特征的捕捉能力，本文在目前BiLSTM+CRF基线模型上加入多头自注意力机制，该机制能在多个不同子空间捕获上下文相关信息来更好地理解和表示句子结构，充分挖掘文本自身蕴含的特征，通过分配权重的方式，突出关键词在抽取中的作用，防止关键信息的缺失。同时为了提取更为深层的特征，本文使用了多层神经网络，为改良深层神经网络容易出现的梯度消失和梯度爆炸问题，本文将一种密集连接（DenseConnection）的网络连接方式应用于中文命名实体识别模型中，使模型收敛更快速。本文将提出的模型在中文数据集上进行评估，与已有的模型进行实验对比。实验表明该模型是可行的，能取得较为先进的结果。本文还对比实验了密集连接方式和直接堆叠神经网络模型，实验表明密集连接方式能取得更好的结果，同时拥有更好的收敛性。随后，本文介绍了本文提出的另一种基于BERT的中文命名实体框架，该框架使用BiGRU+CRF作为模型的主体，GRU网络相比于LSTM网络来说网络结构较为简单，训练更为容易。为了提高抽取的效率，本文使用了一种新的词向量表示方法BERT，该词表示是一种动态的词向量，相比于目前主流词向量来说能够能提供更加丰富的语义，使模型能够捕获到更丰富的中文文本特征，对模型效果有一定的提升，通过实验验证，本文提出的模型取得较高的F1值，与其他模型相比都能取得较为先进的结果。综上所述，本文利用深度学习方式提出的两种中文命名实体识别框架，在通用数据集上识别效率高，拥有良好的可移植性和泛化能力，是比较可行的中文命名实体识别框架。

关键词

中文命名实体识别/多头自注意力机制/密集连接/BiLSTM/GRU/BERT

引用本文复制引用

授予学位

硕士

学科专业

管理科学与工程

导师

唐九阳

学位年度

2019

学位授予单位

国防科技大学

语种

中文

中图分类号

段落导航