国家学术搜索
登录
注册
中文
EN
科技信息(学术版)
2011,
Issue
(10) :
I0103-I0103,I0105.
基于TFIDF特征选择方法的改进
科技信息(学术版)
2011,
Issue
(10) :
I0103-I0103,I0105.
引用
✕
来源:
NETL
NSTL
万方数据
基于TFIDF特征选择方法的改进
扫码查看
点击上方二维码区域,可以放大扫码查看
摘要
TFIDF是常用的特征提取方法,但是该方法存在着很多不足。首先这个方法忽视了如果某词条仅仅在一个类别的文档集中存在次数多,在其他类别中存在次数少,则能说明该词条可以很好地反映类别特征。再者TFIDF忽视了特征与类别的关系。本文提出了改进的TFIDF策略,并结合简单距离向量分类方法与传统的TFIDF进行分类比较,得到了很好的分类效果,试验证明了其可行性。
关键词
TFIDF
/
特征提取
/
简单距离向量
引用本文
复制引用
出版年
2011
科技信息(学术版)
山东省技术开发服务中心
科技信息(学术版)
ISSN:
1001-9960
引用
段落导航
相关论文
摘要
关键词
引用本文
出版年
参考文献
引证文献
同作者其他文献
同项目成果
同科学数据成果