首页|基于密度峰值优化K-means聚类算法的微博舆情分析

基于密度峰值优化K-means聚类算法的微博舆情分析

扫码查看
通过自行开发的爬虫脚本,抓取新浪微博上不同的关键词组成文本数据集,对数据信息进行中文分词、去停用词、权重计算等预处理,然后利用改进的聚类算法对文本聚类分析.针对K-means算法存在随机选取的初始聚类中心导致后期易收敛不能保证全局最优的问题,提出改进的密度峰值算法优化的K-means聚类算法.实验结果表明,与传统的K-means算法相比较,改进后的算法聚类更加有效稳定,提高了微博舆情发现的准确度和效率.
Public Opinion Analysis of Weibo Based on K-means Clustering Algorithm with Peak Density Optimization

叶瑾玫、程科

展开 >

江苏科技大学计算机学院 镇江 212003

K-means算法 聚类中心 密度峰值 微博舆情

2022

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2022.50(4)
  • 1
  • 12