国家学术搜索
登录
注册
中文
EN
重庆理工大学学报
2021,
Vol.
35
Issue
(5) :
135-140,222.
DOI:
10.3969/j.issn.1674-8425(z).2021.05.018
融合卡方统计和TF-IWF算法的特征提取和短文本分类方法
Method of Short Text Classification Based on CHI and TF-IWF Feature Selection
李昌兵
段祺俊
纪聪辉
张婷婷
重庆理工大学学报
2021,
Vol.
35
Issue
(5) :
135-140,222.
DOI:
10.3969/j.issn.1674-8425(z).2021.05.018
下载
引用
认领
✕
来源:
国家科技期刊平台
NETL
NSTL
万方数据
融合卡方统计和TF-IWF算法的特征提取和短文本分类方法
Method of Short Text Classification Based on CHI and TF-IWF Feature Selection
李昌兵
1
段祺俊
1
纪聪辉
2
张婷婷
1
扫码查看
点击上方二维码区域,可以放大扫码查看
作者信息
1.
重庆邮电大学经济管理学院,重庆 400065
2.
重庆邮电大学计算机科学与技术学院,重庆 400065
折叠
摘要
提出一种融合卡方统计和TF-IWF算法的短文本分类方法,通过卡方统计对训练数据集提取特征词,由TF-IWF算法赋予特征词权重,使用SVM分类器进行分类.实验结果表明:融合卡方统计和TF-IWF方法在文本分类准确率上提升3.1%,召回率提升5.2%,F1值提升3.7%.该方法扩大了特征词权重值的范围,使文本集的权值方差增大,一定程度上解决了短文本内容稀疏性的问题,从而提高短文本分类的性能.
关键词
短文本
/
TF-IWF权重
/
特征提取
/
情感分类
引用本文
复制引用
基金项目
国家自然科学基金(60905066/F030707)
出版年
2021
重庆理工大学学报
重庆理工大学
重庆理工大学学报
CSTPCD
北大核心
影响因子:
0.567
ISSN:
1674-8425
下载
引用
认领
被引量
10
参考文献量
16
段落导航
相关论文
摘要
关键词
引用本文
基金项目
出版年
参考文献
引证文献
同作者其他文献
同项目成果
同科学数据成果