中文信息学报2024,Vol.38Issue(2) :36-45.

双重否定结构自动识别研究

The Research on Automatic Recognition of the Double Negation Structure

王昱 袁毓林
中文信息学报2024,Vol.38Issue(2) :36-45.

双重否定结构自动识别研究

The Research on Automatic Recognition of the Double Negation Structure

王昱 1袁毓林2
扫码查看

作者信息

  • 1. 香港理工大学中文及双语系,香港 999077
  • 2. 澳门大学人文学院中国语言文学系,澳门 519000;北京大学中文系/中国语言学研究中心,北京 100871
  • 折叠

摘要

双重否定结构是一种"通过两次否定表示肯定意义"的特殊结构,直接影响自然语言处理中的语义判断与情感分类.该文以"--P==>P"为标准,对现代汉语中所有的"否定词+否定词"结构进行了遍历研究,将双重否定结构按照格式分为了 3大类,25小类,常用双重否定结构或构式132个.结合动词的叙实性、否定焦点、语义否定与语用否定等理论,该文归纳了双重否定结构的三大成立条件,并据此设计实现了基于规则的双重否定结构自动识别程序.程序实验的精确率为98.80%,召回率为98.90%,F1值为98.85%.同时,程序还从96 281句语料中获得了 8 640句精确率约为99.20%的含有双重否定结构的句子,为基于统计的深度学习模型提供了语料支持.

Abstract

The double negation structure is a special structure of"expressing positive meaning through two nega-tions",in which the two negations have an important impact on the semantic analysis and emotional classification in natural language processing.Taking"--P==>P"as the prototype,this paper examines the"negation word+negation word"structures in modern Chinese,and divides them into 3 categories,25 sub-categories and 132 con-structions in total.Then this paper proposes three conditions for the establishment of the double negation structure,and a rule-based method to identify the double negation.The accuracy rate of recognition of the double negation structure is 98.80%,the recall rate is 98.90%,and the F1 value is 98.95%.The proposed method could identify 8 640 sentences with 99.20%true double negation structure from 96 281 sentences.

关键词

双重否定/自动识别程序/语义分析

Key words

double negation/automatic recognition program/semantic analysis

引用本文复制引用

基金项目

国家科技创新2030"新一代人工智能"重大项目(2020AAA0106701)

国家社会科学基金(18ZDA295)

出版年

2024
中文信息学报
中国中文信息学会,中国科学院软件研究所

中文信息学报

CSTPCDCSCDCHSSCD北大核心
影响因子:0.8
ISSN:1003-0077
参考文献量21
段落导航相关论文