面向XGBoost的课程评价文本智能分类模型

扫码查看

原文链接

国家科技期刊平台
NETL
NSTL
万方数据
维普

中文摘要：对数据量大的评价文本内容进行分类分析较困难,为解决这一难题,提出面向XGBoost的评价文本智能分类模型,在样本不均衡问题下采用随机欠采样方法进行处理,对文本内容使用jieba分词和停用词进行词向量表示,使用PCA(主成分分析)进行特征降维,使用交叉验证方法寻找XGBoost最优参数.为验证模型的有效性,分别在1647条数据以及9994条数据上进行实验.实验结果表明,XGBoost模型在评价文本分类时精准率、召回率、F1值分别达到了87.62％、87.73％、87.67％.面向XGBoost的评价文本智能分类模型不仅能快速对数量大的评价文本内容进行分类,而且能有效降低人工分类误差.

外文标题：Course Evaluation Text Classification Model Based on XGBoost

作者：

晋百川、杨鸿波、胡大胆

展开 >

作者单位：

北京信息科技大学自动化学院,北京100192

关键词：

文本分类 jieba分词 XGBoost模型随机欠采样交叉验证

出版年：

2021

DOI：

10.11907/rjdk.202560