摘要
进入信息化时代,如何使机器真正理解自然语言是自然语言处理中的一项重要任务,语义标注以及语义分析一直是机器理解自然语言的难点和重点,尤其是汉语中存在一些特殊结构,如兼语句、连动句、主谓谓语句、把字句等。 依存语法是一种研究句子内部词与词之间联系的语法理论,核心概念是“依存关系”,通过建立这种依存关系,就能达到句子语义分析和理解的目的。依存语法能将深层语义结构表现为表层句法结构,这使得依存语法特别适合“意合”的汉语,适用于中文信息处理领域。 汉语中存在一类以“多动词”为核心的复杂谓语结构,本文称之为同动式。这类结构虽属单句,语表形式上和兼语式完全相同,但其内部语义却存在多类交缠的情形,是中文信息处理的难题。 本文主要以依存语法理论为指导,以连动式和兼语式为参照,对现代汉语同动式的语义依存关系进行考察,并运用Dependency Viewer等工具,对现代汉语同动式的语义依存关系进行可视化。核心提要如下: 第一,现代汉语同动式是一类和兼语式、连谓式处于并列地位的特殊句式,不宜用“连谓兼语融合式”来称说此类结构。 第二,同动式的定义为“词性序列如‘NP1+VP1+NP2+VP2’且NP1和NP2同为VP2施事主语的复杂结构”,外延上与连谓式、兼语式不存在交叉,三者在语表形式、语义关系上都存在区别。 第三,从同动式内部各个组成成分出发,从VP1的确立、VP2的参与容纳数量及其对名词项的选择以及NP1和NP2共同施动关系三个方面讨论了同动式结构语义上的特点。 第四,对同动式进行依存分析。从语法、语义、信息结构上将同动式的依存核心规定为内部的原因事件,由此构建出了同动式语义依存图模型,通过实际语料验证模型的正确性,采取了CONLL格式标注语料,并通过Depend ency Viewer操作平台进行可视化呈现。