信息技术与信息化2024,Issue(4) :106-109.DOI:10.3969/j.issn.1672-9528.2024.04.023

基于特征聚类与降维的新闻文本智能分类算法

张鸿彦
信息技术与信息化2024,Issue(4) :106-109.DOI:10.3969/j.issn.1672-9528.2024.04.023

基于特征聚类与降维的新闻文本智能分类算法

张鸿彦1
扫码查看

作者信息

  • 1. 河南工程学院 河南郑州 450000
  • 折叠

摘要

文本分类是当前智能处理新闻数据信息的一种有效手段.为了提高信息处理的准确性和有效性,提出基于特征聚类与降维的新闻文本智能分类算法.首先,利用汉语词汇分析系统ICTCLAS对新闻文本分词作预处理,去除其中的停用词,并区分新闻文本的词性.然后,利用权重函数对新闻文本作降维处理,约简新闻文本的关键词集.最后,采用聚类分析技术对新闻文本特征实施聚类,得到不同类别的新闻文本.实验表明,所提出的算法得到的分类结果准确率在 96%以上,召回率在 98%以上,说明所提出的算法能够实现对新闻文本智能精准分类,具有良好的应用前景.

关键词

特征聚类/降维处理/新闻文本/智能分类/汉语词汇分析系统/权重函数

引用本文复制引用

基金项目

河南省高等学校重点科研项目(22A520022)

河南工程学院横向科研项目(HKJ2021139)

出版年

2024
信息技术与信息化
山东电子学会

信息技术与信息化

影响因子:0.29
ISSN:1672-9528
参考文献量12
段落导航相关论文