首页|基于Hadoop平台的一种改进K-means文本聚类算法

基于Hadoop平台的一种改进K-means文本聚类算法

扫码查看
K-means算法是进行文本聚类时使用最为广泛的一种推荐算法之一.该算法在进行文本聚类时每个属性的作用是同等的,而实际中每个属性对文本的影响是不同的,导致聚类效果受到影响.针对该缺点,通过引入属性权重提出了一种改进的K-means聚类算法,并在Hadoop平台加以实现,以更好体现改进算法的效率.通过实验进行了测试,表明所提出的改进算法在效率和精度方面均有所提高.
An Improved Algorithm for Text Clustering Based on Hadoop Platform

潘俊辉、王辉、张强、王浩畅

展开 >

东北石油大学,计算机与信息技术学院,黑龙江,大庆163318

K-means 文本聚类 属性权重 Hadoop

国家自然科学基金东北石油大学青年科学基金

617020932020QNL-02

2022

微型电脑应用
上海市微型电脑应用学会

微型电脑应用

CSTPCD
影响因子:0.359
ISSN:1007-757X
年,卷(期):2022.38(1)
  • 3
  • 3