首页|面向XGBoost的课程评价文本智能分类模型

面向XGBoost的课程评价文本智能分类模型

扫码查看
对数据量大的评价文本内容进行分类分析较困难,为解决这一难题,提出面向XGBoost的评价文本智能分类模型,在样本不均衡问题下采用随机欠采样方法进行处理,对文本内容使用jieba分词和停用词进行词向量表示,使用PCA(主成分分析)进行特征降维,使用交叉验证方法寻找XGBoost最优参数.为验证模型的有效性,分别在1647条数据以及9994条数据上进行实验.实验结果表明,XGBoost模型在评价文本分类时精准率、召回率、F1值分别达到了87.62%、87.73%、87.67%.面向XGBoost的评价文本智能分类模型不仅能快速对数量大的评价文本内容进行分类,而且能有效降低人工分类误差.
Course Evaluation Text Classification Model Based on XGBoost

晋百川、杨鸿波、胡大胆

展开 >

北京信息科技大学自动化学院,北京100192

文本分类 jieba分词 XGBoost模型 随机欠采样 交叉验证

2021

软件导刊
湖北省信息学会

软件导刊

影响因子:0.524
ISSN:1672-7800
年,卷(期):2021.20(9)
  • 1
  • 10