国家学术搜索
登录
注册
中文
EN
首页
|
面向XGBoost的课程评价文本智能分类模型
面向XGBoost的课程评价文本智能分类模型
下载
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
国家科技期刊平台
NETL
NSTL
万方数据
维普
中文摘要:
对数据量大的评价文本内容进行分类分析较困难,为解决这一难题,提出面向XGBoost的评价文本智能分类模型,在样本不均衡问题下采用随机欠采样方法进行处理,对文本内容使用jieba分词和停用词进行词向量表示,使用PCA(主成分分析)进行特征降维,使用交叉验证方法寻找XGBoost最优参数.为验证模型的有效性,分别在1647条数据以及9994条数据上进行实验.实验结果表明,XGBoost模型在评价文本分类时精准率、召回率、F1值分别达到了87.62%、87.73%、87.67%.面向XGBoost的评价文本智能分类模型不仅能快速对数量大的评价文本内容进行分类,而且能有效降低人工分类误差.
外文标题:
Course Evaluation Text Classification Model Based on XGBoost
收起全部
展开查看外文信息
作者:
晋百川、杨鸿波、胡大胆
展开 >
作者单位:
北京信息科技大学自动化学院,北京100192
关键词:
文本分类
jieba分词
XGBoost模型
随机欠采样
交叉验证
出版年:
2021
DOI:
10.11907/rjdk.202560
软件导刊
湖北省信息学会
软件导刊
影响因子:
0.524
ISSN:
1672-7800
年,卷(期):
2021.
20
(9)
被引量
1
参考文献量
10