首页|FCG-NNER:一种融合字形信息的中文嵌套命名实体识别方法

FCG-NNER:一种融合字形信息的中文嵌套命名实体识别方法

扫码查看
基于跨度的模型是嵌套命名实体识别的主要方法,其核心是将实体识别问题转化为跨度分类问题.而在中文数据集中,由于中文单词不具有明显的分割符号,导致语义和边界信息不明确,进而造成中文嵌套命名实体识别效果不佳.为了解决这一问题,提出了融合字形信息的基于跨度的中文嵌套命名实体识别算法——FCG-NNER,首先通过卷积神经网络获取汉字的字形信息,其次通过交叉Biaffine双仿射解码层实现原文信息与字形信息融合,然后通过对角融合CNN层获取不同跨度之间的局部相互作用,最后将交叉Biaffine双仿射解码层的输出与对角融合CNN层的输出相加后输入到全连接层中,得到最终的预测结果.采用2个具有代表性的中文嵌套NER数据集(CMeEE和CLUENER2020)用于实验验证.结果显示,FCG-NNER在CMeEE数据集中的精度为65.02%,召回率为67.93%,F1值达到0.6644;在CLUEN-ER2020数据集中的精度为79.45%,召回率为82.33%,F1值达到0.8086,证明FCG-NNER算法的性能明显超过2个数据集的基线.
FCG-NNER: A Chinese nested named entity recognition method fused with glyph information

Chinese nested named entity recognitioncharacter-level featuresspan classificationfeature fusion

陈鹏、马洪彬、周佳伦、李琳宇、余肖生

展开 >

三峡大学 湖北省水电工程智能视觉监测重点实验室,湖北 宜昌 443002

三峡大学 计算机与信息学院,湖北 宜昌 443000

中文嵌套命名实体识别 字形特征 跨度分类 特征融合

国家重点研究发展计划资助项目

2016YFC0802500

2023

重庆理工大学学报
重庆理工大学

重庆理工大学学报

CSTPCD北大核心
影响因子:0.567
ISSN:1674-8425
年,卷(期):2023.37(23)
  • 20