SaGE:基于句法感知图卷积神经网络和ELECTRA的中文隐喻识别模型
SaGE:Syntax-aware GCN with ELECTRA for Chinese Metaphor Detection
张声龙 1刘颖 1马艳军2
作者信息
- 1. 清华大学 人文学院,北京 100084
- 2. 北京百度网讯科技有限公司 深度学习技术平台部,北京 100085
- 折叠
摘要
隐喻是人类语言中经常出现的一种特殊现象,隐喻识别对于自然语言处理各项任务来说具有十分基础和重要的意义.针对中文领域的隐喻识别任务,该文提出了一种基于句法感知图卷积神经网络和 ELECTRA的隐喻识别模型(Syntax-aware GCN with ELECTRA,SaGE).该模型从语言学出发,使用 ELECTRA和Transformer编码器抽取句子的语义特征,将句子按照依存关系组织成一张图并使用图卷积神经网络抽取其句法特征,在此基础上对两类特征进行融合以进行隐喻识别.该模型在CCL 2018 中文隐喻识别评测数据集上以 85.22%的宏平均F1值超越了此前的最佳成绩,验证了融合语义信息和句法信息对于隐喻识别任务具有重要作用.
Abstract
Metaphor is a special phenomenon in human languages.As for Metaphor Detection in Chinese,we propose a SaGE(Syntax-aware GCN with ELECTRA)method inspired by linguistics.SaGE utilizes ELECTRA and Trans-former encoder to extract the semantic feature of a sentence,and the GCN to extract syntactic feature through a graph constructed by dependency parsing result.The model concatenates the two features to detect metaphors.SaGE obatins 85.22%macro-F1 score,a substantial improvement over the best reported score in CCL 2018 Chinese Meta-phor Detection Task Dataset.
关键词
隐喻识别/ELECTRA/图卷积神经网络/依存句法Key words
metaphor detection/ELECTRA/GCN/dependency parsing引用本文复制引用
基金项目
清华大学人文社会科学振兴项目(2019THZWJC38)
教育部人文社会科学研究一般项目(17YJAZH056)
国家社会科学基金(18ZDA238)
百度网讯科技有限公司项目()
出版年
2024