计算机技术与发展2023,Vol.33Issue(2) :181-186,194.DOI:10.3969/j.issn.1673-629X.2023.02.027

基于多头注意力的电网调度领域命名实体识别

Named Entity Recognition in Grid Dispatch Domain Based on Multi-headed Attention

毛宏亮 艾孜尔古丽 陈德刚
计算机技术与发展2023,Vol.33Issue(2) :181-186,194.DOI:10.3969/j.issn.1673-629X.2023.02.027

基于多头注意力的电网调度领域命名实体识别

Named Entity Recognition in Grid Dispatch Domain Based on Multi-headed Attention

毛宏亮 1艾孜尔古丽 2陈德刚1
扫码查看

作者信息

  • 1. 新疆师范大学 计算机科学技术学院,新疆 乌鲁木齐 830054
  • 2. 新疆师范大学 计算机科学技术学院,新疆 乌鲁木齐 830054;国家语言资源监测与研究少数民族语言中心,新疆 乌鲁木齐 830000
  • 折叠

摘要

针对电网调度领域实体识别准确率较低的问题,提出一种融合多头注意力机制和双向长短时记忆网络的电网调度领域中文命名实体识别方法.利用词向量表示电网调度语音识别后语句,并将生成的词向量序列输入双向长短时记忆网络(BiLSTM)挖掘其上下文语义特征,引入多头注意力机制重点关注文本中的实体词,挖掘其隐藏特征,同时通过条件随机场(CRF)计算序列标签的联合概率标注出实体识别结果.根据电网调度语音识别后文本特点自建标注数据集,并将电网调度语音识别文本中的命名实体细粒度划分为参数、设备、操作、系统、组织5个类别进行实验.其结果表明,该方法对电网调度领域实体识别具有更高的准确率和召回率,且F1值可达到93.63%,切实解决了电网调度领域实体识别任务中标注数据稀少和精度较低的问题,有助于电网调度领域知识图谱的构建.

关键词

实体识别/电网调度/多头注意力/双向长短时记忆/联合概率/知识图谱

引用本文复制引用

基金项目

国家自然科学基金(61662081)

新疆维吾尔自治区自然科学基金(2017D01A58)

国家语言资源监测与研究中心少数民族语言分中心项目(NMLR201602)

出版年

2023
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
被引量1
参考文献量7
段落导航相关论文