摘要
随着互联网的普及和发展,人们在使用网络进行交流的同时,也在网络平台上产生了大量的评论数据。对这些评论数据进行情感分析,可以发掘其中所蕴含的社会和商业等方面的价值,这已经成为自然语言处理领域的一个重要研究方向。 方面级情感分析是情感分析领域中的一个重要子领域,旨在识别文本中关于某个具体方面或目标的情感和态度信息,从而可以更加精细地理解文本所表达的情感和态度。然而,随着新兴领域不断涌现,相应的标注数据也变得短缺。为了获取足够的情感标记,需要耗费大量时间和人力成本。因此,在这种情况下,利用现有领域的标注数据进行跨领域情感分析的研究具有十分重要的意义。 本文针对单一领域和跨领域的方面级情感分析方法展开研究,主要工作如下: 一、以往基于图卷积神经网络的情感分析方法主要关注和研究句法依赖关系的结构,但这种结构存在噪声和稀疏等问题。此外,这些方法往往只关注句法依赖关系,而忽略了单词之间潜在的其他关系。基于此,本文提出一种句法增强的图卷积神经网络模型来缓解以上问题。模型从两个不同的角度来对文本信息进行特征提取,使用句法解析信息和单词之间的点互信息来获得句子中单词之间的潜在语义关联。在三个公开的基准数据集上的实验结果表明,该模型在大部分情况下都优于其它基准模型。 二、现有的研究在跨域方面级情感分类任务中更多地关注文本的序列建模,很大程度上忽略了句法依赖等领域不变知识。基于此,本文提出了一种基于对抗领域自适应的模型来缓解上述问题。模型使用关注句法结构的图卷积神经网络模型来提取句法信息和其他相关知识,采用对抗领域自适应的技术来学习领域不变知识。此外,模型还使用了基于类中心的特征对齐方法来实现领域之间更细粒度的数据特征对齐。最后通过实验对比,验证了该模型的有效性。