摘要
文本分类是当前智能处理新闻数据信息的一种有效手段.为了提高信息处理的准确性和有效性,提出基于特征聚类与降维的新闻文本智能分类算法.首先,利用汉语词汇分析系统ICTCLAS对新闻文本分词作预处理,去除其中的停用词,并区分新闻文本的词性.然后,利用权重函数对新闻文本作降维处理,约简新闻文本的关键词集.最后,采用聚类分析技术对新闻文本特征实施聚类,得到不同类别的新闻文本.实验表明,所提出的算法得到的分类结果准确率在 96%以上,召回率在 98%以上,说明所提出的算法能够实现对新闻文本智能精准分类,具有良好的应用前景.