首页|文本特征和图结点混合增强的图卷积网络文本分类

文本特征和图结点混合增强的图卷积网络文本分类

扫码查看
在BertGCN模型的基础上改进其结构,同时结合文本特征和图结点混合增强的方法,使用新的边权重计算算法BM25+构造图的边.使用R8、R52、Ohsumed和MR这4个常用的公开数据集来验证所提方法的有效性.结果表明:与BertGCN模型及其它基线模型相比,该方法在4个文本分类数据集上的准确率评价指标均有不同程度的提升.
Hybrid Augmentation of Text Feature and Graph Node for Graph Convolutional Networks Text Classification
The work will improve the structure on the basis of the BertGCN model,not only using a new algorithm to construct the edges of the graph,but also combining a hybrid enhancement of text features and graph nodes.The method not only has some optimization in the edge structure,but also makes fuller use of the extended semantic information of the text in the form of text feature enhancement and graph-enhanced nodes,while retaining the original text features.Four public datasets,R8,R52,Ohsumed and MR which are commonly used,are used to verify the effectiveness of this method.The experimental results show that compared with the BertGCN model and other baselines,the accuracy evaluation metric of the method on the four text classification data sets has been improved to varying degrees.

BM25+text feature enhancementgraph node enhancementpre-training modelgraph convolution networkstext classification

杨晓奇、刘伍颖

展开 >

广东外语外贸大学信息科学与技术学院,广东广州 510006

鲁东大学山东省语言资源开发与应用重点实验室,山东烟台 264025

广东外语外贸大学外国语言学及应用语言学研究中心,广东广州 510420

BM25+ 文本特征增强 图结点增强 预训练模型 图卷积网络 文本分类

教育部人文社会科学研究规划基金&&上海市哲学社会科学规划项目

20YJAZH06920YJC7400622019BYY028

2024

新疆大学学报(自然科学版)(中英文)
新疆大学

新疆大学学报(自然科学版)(中英文)

CSTPCD
影响因子:0.13
ISSN:2096-7675
年,卷(期):2024.41(1)
  • 3