中国安全科学学报2023,Vol.33Issue(6) :20-26.DOI:10.16265/j.cnki.issn1003-3033.2023.06.1416

基于NLP的煤矿事故原因分类研究

Study on classification of coal mine accident causes based on NLP

张江石 李泳暾 冒香凝 胡馨月 潘雨 王梓伊
中国安全科学学报2023,Vol.33Issue(6) :20-26.DOI:10.16265/j.cnki.issn1003-3033.2023.06.1416

基于NLP的煤矿事故原因分类研究

Study on classification of coal mine accident causes based on NLP

张江石 1李泳暾 1冒香凝 1胡馨月 1潘雨 1王梓伊1
扫码查看

作者信息

  • 1. 中国矿业大学(北京)应急管理与安全工程学院,北京100083
  • 折叠

摘要

为有效提升分析和处理煤矿事故文本的效率,融合自然语言处理(NLP)技术与事故致因模型,构建一个自动化的事故原因分类框架.首先以事故致因"2-4"模型(24Model)为事故分类依据,分析87份煤矿事故调查报告,得到煤矿事故原因分类框架,构建每类事故原因的语料库;然后利用NLP技术分别处理语料库中各类原因文本,将其用于训练fastText模型,自动识别事故原因文本并分类;最后对比分析fastText模型与TextCNN等其他3种经典模型的分类效果.结果表明:共得到21类事故原因和6 684条训练语料,训练后的fastText模型对煤矿事故原因分类的识别正确率能够达到98.92%,综合性能优于其他3种分类模型.基于24Model和NLP技术开发的事故文本挖掘系统,能够快速分析处理事故文本信息,进一步细化事故调查报告中的原因,便于进行事故案例学习和统计分析.

关键词

自然语言处理(NLP)/事故原因分类/"2-4"模型(24Model)/fastText/文本挖掘

Key words

natural language processing(NLP)/classification of accidents causes/"2-4"model(24Model)/fastText/text mining

引用本文复制引用

出版年

2023
中国安全科学学报
中国职业安全健康协会

中国安全科学学报

CSTPCDCSCD北大核心
影响因子:1.548
ISSN:1003-3033
被引量3
参考文献量6
段落导航相关论文