摘要
传统命名实体方法识别准确率不高,难以在知识领域得到有效体现.基于RoBERTa-BiLSTM-CRF模型进行改进,在RoBERTa与BiLSTM层之间增加CNN进行局部特征提取.通过BERT改进版RoBERTa,将文本序列转换为高维向量表示,捕捉深层语义信息.CNN进行卷积操作,生成捕捉文本局部信息的特征图.BiLSTM结合前后文信息编码序列.CRF层计算标签序列得分,通过动态规划找到最高得分的标签序列作为标注结果.实验结果的P、R、F1指标提升1.11%、1.21%、1.08%,该模型具备较高的准确性.