首页|词汇化概率句法分析与动词子语类框架获取的互动方法

词汇化概率句法分析与动词子语类框架获取的互动方法

扫码查看
概率句法分析器(PCFG Parser)是基于概率规则集的上下文无关文法的句法分析器.规则集主要是针对词类和短语类.然而事实上,词性相同而词汇不同,其所常用的句法规则也通常不同.目前NLP研究的一个趋势和热点就是词汇化的句法分析.针对概率句法分析独立性假设中缺乏词汇化的缺陷,本文将谓语动词的子语类信息与概率句法分析结合起来,提出一种基于动词予语类信息的词汇化概率句法分析方法.论文建立了基于汉语动词子语类框架的统计句法分析模型,并且针对动词子语类框架难以获取的问题,提出一种词汇化概率句法分析与动词子语类框架获取的互动方法.实验利用这种互动的方法获取了汉语中十个常用高频动词的概率化子语类信息,并结合原有的概率句法分析器PCFG实现了一个基于动词子语类信息的概率句法分析器原型系统S-PCFG.实验证明了基于动词子语类信息的概率句法分析对自然语言句法分析的准确率和速度均有所提高.同时分析了新的概率句法分析器的不足之处,为进一步的改进提供条件.

冀铁亮、穗志方

展开 >

北京大学计算语言研究所,北京,100871

词汇化概率句法 子语类框架 词汇知识 自动获取 句法分析

中国中文信息学会

沈阳航空工业学院

第三届学术计算语言学研讨会

2006-08-15

沈阳

第三届学生计算语言学研讨会论文集

38-43

2006