首页|多维字符特征表示的铁路设备事故信息抽取方法

多维字符特征表示的铁路设备事故信息抽取方法

Information extraction method for railway equipment accidents based on multi-dimensional character feature representation

扫码查看
为解决铁路设备事故调查报告数据分析困难的问题,提出基于多维字符特征表示设备事故信息抽取方法,在数据预处理阶段,提出主题模式匹配方法,抽取命名实体所属的主题段落;在文本特征表示中,提出多维特征表示方法将文本转化为特征向量;采用长短时记忆网络(BiLSTM)与条件随机场(CRF)神经网络实现铁路设备事故命名实体识别模型训练;采用铁路设备事故调查报告进行试验验证.结果表明:通过主题模式匹配预处理,多维字符特征+BiLSTM+CRF模型的综合评价指标提升22.86%,多维字符特征表示方法相比word2vec特征表示方法,能够使BiLSTM+CRF模型的综合评价指标提升4.89%.

张鹏翔

展开 >

中国铁道科学研究院集团有限公司标准计量研究所,北京100081

多维字符特征 铁路设备事故 信息抽取 主题模式匹配 命名实体识别

2022

中国安全科学学报
中国职业安全健康协会

中国安全科学学报

CSTPCDCSCD北大核心
影响因子:1.548
ISSN:1003-3033
年,卷(期):2022.32(6)
  • 2
  • 10