首页|Corrective-Net:面向多标签文本分类的标签关联学习模块

Corrective-Net:面向多标签文本分类的标签关联学习模块

扫码查看
在目前的多标签文本分类任务中,主要面临以下2个问题:(1)侧重文本表示学习,对标签之间的关联信息建模不充分;(2)尽管使用了标签关联信息来改善多标签分类任务,但对标签关联的建模过于依赖人工预定义的外部知识,而外部知识的获取成本高昂,限制了其实际应用。针对以上问题,提出了一种面向多标签文本分类的标签关联学习模块Corrective-Net。该模块可以在不依赖外部知识的前提下,自动学习数据中的标签关联信息;同时,它还可以利用标签关联信息,对基础分类模块的初始预测结果进行修正,使得最终预测兼顾语义信息和标签关联信息,以获得更精准的多标签预测结果。在AAPD和SO数据集上的大量实验表明,Corrective-Net具有通用性和有效性,通过分析标签修正对各个标签性能的影响,得到了显式的标签关联信息,并进行了可视化。
Corrective-Net:A label association learning module for multi-label text classification
In the current multi-label text classification tasks,the following two problems are mainly faced:(1)Emphasis is placed on the learning of text representation,and the modeling of the association information between labels is insufficient;(2)Although label association information is used to improve multi-label classification tasks,its modeling of label association relies too much on manually predefined external knowledge,and the acquisition cost of external knowledge is high,which limits its practical ap-plication.To solve the above problems,this paper proposes a label association learning module for multi-label text classification,called Corrective-Net.The module can automatically learn label associa-tion information in data without relying on external knowledge.At the same time,it can also use label association information to modify the initial prediction of the basic classification module,so that the final prediction takes into account semantic information and label association information,so as to obtain more accurate multi-label prediction.A large number of experiments on AAPD and SO data sets show the universality and effectiveness of Corrective Net.The effects of corrective label corrections on the performance of each label are analyzed.Explicit label association information is obtained and visualized.

label associationlabel correctionmulti-labeltext classificationvisualization

肖新正、黄瑞章、陈艳平、秦永彬、宋玉梅、周裕林

展开 >

文本计算与认知智能教育部工程研究中心,贵州 贵阳 550025

公共大数据国家重点实验室,贵州 贵阳 550025

贵州大学计算机科学与技术学院,贵州 贵阳 550025

标签关联 标签修正 多标签 文本分类 可视化

国家自然科学基金国家自然科学基金贵州省教育厅高等学校科学研究青年项目

6206600762066008黔教技[2022]149号

2024

计算机工程与科学
国防科学技术大学计算机学院

计算机工程与科学

CSTPCD北大核心
影响因子:0.787
ISSN:1007-130X
年,卷(期):2024.46(6)