摘要
隐喻是日常表达和交流中一种不可替代的修辞手段,认知语言学研究表明隐喻是人类一种重要的认知手段。由于隐喻具有复杂性和微妙性的特点,它成为了自然语言处理任务中不可忽视的障碍。本文针对隐喻计算处理中的隐喻识别和隐喻释义问题进行深入分析,并结合深度学习相关技术和预训练语言模型提出了解决方案。 在隐喻识别任务方面,提出基于Transformer和图卷积神经网络的隐喻识别模型,解决隐喻识别中单词和多词隐喻识别问题。该模型通过两个Transformer结构分别对隐喻句的全局上下文信息和目标词周围的局部上下文信息进行特征提取,以此获得丰富上下文语义表示。并引入图卷积神经网络学习句子的句法结构信息,利用句子中词与词之间的依赖关系有效解决了多词隐喻识别问题。然后,使用多头注意力选取全局上下文信息和局部上下文信息中有效的深层隐喻特征,再联合句法结构信息,最终输入到分类层进行预测。在英文数据集UVA、TOEFL和中文数据集CCL上进行实验,在UVAVERB和UVAALLPOS上F1值分别达到了78.6%和82.3%,在TOEFLVERB和TOEFLALLPOS上F1值分别达到了73.4%和76.2%,在CCL上F1值达到了90%,证明了图卷积网络和句法依存树的引入确实能在一定程度上丰富目标词语义信息,以此提高单词和多词隐喻的识别效果。 在隐喻释义任务方面,提出了基于上下文语境的隐喻释义生成框架。首先,按照隐喻依存模型对隐喻信息进行标注,形成结构化数据。然后,提出基于WordNet的属性匹配算法解决隐喻释义中源域属性和目标域属性相似度计算问题,挖掘源域属性和目标域属性的潜在语义相似性。基于属性匹配算法对名词型隐喻和动词型隐喻采取不同的语义特征构建方法。最后,本文通过BERT捕获上下文语境信息,预测语义特征集中的字面义对应词,并按照相应规则生成隐喻释义句。为了验证该方法的有效性和准确性,本文在文学比喻词典数据集和VUA数据集上进行实验。对于名词型隐喻,本文方法在文学比喻词典数据集和VUA数据集上准确度分别到达了81%和82%;对于动词型隐喻,本文方法在在文学比喻词典数据集和VUA数据集上准确度分别到达了84%和86%。 基于隐喻识别与隐喻释义的研究工作,设计并实现隐喻计算系统。该系统以隐喻信息标注为核心,提供隐喻识别与隐喻释义生成等核心功能。