摘要
推特等社交媒体为药物不良反应监测提供了新的信息源.本文结合深度学习技术从海量的社交媒体用户评论中监测出其是否有关药物不良反应推文.为了提高精度,丰富推文的信息特征,提出一种端到端的基于注意力机制BiLSTM-CharCNN神经网络模型.首先,使用CharCNN模型提取字符级特征:对文本进行字符数字化,再做卷积池化和全连接操作,得到字符级特征向量;然后,使用Attention-BiLSTM模型提取特征向量:通过调整权重参数,去除掉冗余信息,提取关键部分的信息,对文本进行优化;最后,将两种方法提取到的特征信息进行连接,再到包含一个全连接和一个softmax的输出层进行分类操作.实验结果证明,该方法可以显著提高分类的准确性,且效果优于现有的基准方法.