摘要
自新冠肺炎疫情爆发以来,微博作为一种重要的信息传播载体,在疫情信息发布与传播中发挥着重要作用。深入分析疫情信息中蕴含的疫情事件及其对网民情绪的影响,有助于各级政府准确掌握网络舆论情况,科学高效地做好防控宣传和舆情引导工作。因此,本文对疫情事件画像构建、网民情绪画像构建和影响分析三方面进行研究,具体工作如下: 1.疫情事件画像构建过程中,首先从微博爬取2019年12月01日到2020年4月30日之间与新冠肺炎疫情相关新闻26478条,通过数据清洗和人工标注,构建了疫情事件抽取语料库,并将其按照捐资、防控、英雄和临床四类主题进行分类。然后,使用Word2vec模型训练事件抽取语料库得到含有疫情事件语义信息的向量表示。最后,利用BILSTM-CRF模型进行语义特征提取,完成疫情事件抽取。其中四类主题疫情事件的准确率、召回率、F值均达到80%以上,疫情事件元素时间、地点、人物的识别较为良好,准确率、召回率和F值都在70%以上,其中时间的F值较高,达到了80.8%。 2.网民情绪画像构建过程中,首先从微博爬取2019年12月01日到2020年4月30日之间网民对新冠肺炎疫情相关新闻的评论30万条,通过数据预处理和人工标注,构建了网民情绪分析语料库。然后,利用中文情感词汇本体库、修饰词词典和结合网络文本特征利用点互信息法构建的表情符号词典,计算文本情感强度计算,根据计算结果将网民情绪划分为:乐观、美好、悲哀、愤怒、畏惧、厌恶和惊吓七种。最后,利用融合注意力机制的双向循环神经网络模型(ATT-BIRNN)进行网民情绪的特征提取,网民情绪识别的F值最高达到91.3%,并且在验证ATT-BIRNN模型对网民情绪分析的有效性的对比实验中,ATT-BIRNN模型F值最高为90.9%。 3.影响分析过程中,利用BERT-ATT-BILSTM模型学习疫情事件与网民情绪之间的关联语义信息,得到疫情事件发展过程中网民情绪的动态变化结果,并对实验结果进行了客观分析。在验证BERT-ATT-BILSTM模型有效性的对比实验中,疫情事件对网民情绪的关联分析的准确率、召回率、F值均达到了83%以上,其中对“英雄”主题事件的F值达到了86%。