首页|基于语义相似度的汉语未登录动词语义框架识别

基于语义相似度的汉语未登录动词语义框架识别

罗思明

基于语义相似度的汉语未登录动词语义框架识别

罗思明1
扫码查看

作者信息

  • 1. 北京邮电大学
  • 折叠

摘要

在自然语言处理领域中,语义角色标注是获取语义信息的一种重要手段。汉语语义角色标注一般可采用有监督方法、无监督方法以及半监督方法。由于缺乏大规模的手工标注语料,因此采用半监督方法建立语义角色标注系统。对于半监督方法,目前存在的一个严重的问题是数据稀疏问题。语义角色标注系统采用的半监督方法主要依赖于一个动词语义框架词典和一个名词分类词典,它们均存在着数据稀疏问题。其中,动词语义框架词典对于语义角色标注起着重要作用,本论文的研究内容为解决语义角色标注系统的数据稀疏问题,其中,主要解决关于动词语义框架词典的数据稀疏问题,即未登录动词的语义框架识别问题。 动词语义框架识别在半监督语义角色标注方法中是一个关键的步骤,本文提出了一种基于语义相似度的未登录动词语义框架识别方法。本方法首先计算未登录动词与已登录动词的语义相似度,确定未登录动词的候选语义框架,然后通过将候选语义框架与未登录动词所在句子的论元框架进行匹配,得到未登录动词的语义框架。在本论文中,尝试采用两种相似度计算方法来进行实验,以得出最有效的相似度计算方法,来提高未登录动词语义框架识别的效果。这两种方法分别是基于《同义词词林》和《知网》的语义相似度计算方法。通过实验表明,语义角色标注在增加了未登录动词语义框架识别后,基于《同义词词林》的方法使得原有语义角色标注系统的对未登录动词对应句子的标注正确率由72%提高到76%。基于《知网》的方法使得标注正确率由72%提高到81%。其中的部分方法也可使用到名词词典的稀疏问题解决。

关键词

基于/语义相似度/汉语/动词/语义框架

引用本文复制引用

授予学位

硕士

学科专业

控制理论与控制工程

导师

王小捷

学位年度

2008

学位授予单位

北京邮电大学

语种

中文
段落导航相关论文