计算机时代2023,Issue(9) :120-123,128.DOI:10.16644/j.cnki.cn33-1094/tp.2023.09.025

烟草零售数据挖掘与聚类噪声消除方法研究

Research on retail data mining and clustering noise elimination method

赵海建 向俊宇 杨迎镭
计算机时代2023,Issue(9) :120-123,128.DOI:10.16644/j.cnki.cn33-1094/tp.2023.09.025

烟草零售数据挖掘与聚类噪声消除方法研究

Research on retail data mining and clustering noise elimination method

赵海建 1向俊宇 1杨迎镭1
扫码查看

作者信息

  • 1. 重庆中烟工业有限责任公司,重庆 400060
  • 折叠

摘要

烟草零售环节积累了大量交易数据,但其中隐藏的有价值的信息还未被有效挖掘.本文针对某省烟草零售户卷烟进销存流水数据进行数据挖掘研究.在原始数据清洗和预处理之后,对于零售户分类中遇到的噪声数据,运用K-means算法进行聚类.对聚类中的噪声干扰,提出了离群点消除方法,将离群点划分到另外的Voronoi单元中,增强正常数据点的聚类有效性.该系统在营销实践过程中得以应用,证明了方法的有效性.

关键词

零售数据/数据挖掘/K-means/离群点检测/Voronoi单元

Key words

retail data/data mining/K-means/outlier detection/Voronoi Unit

引用本文复制引用

出版年

2023
计算机时代
浙江省计算技术研究所 浙江省计算机学会

计算机时代

影响因子:0.411
ISSN:1006-8228
参考文献量6
段落导航相关论文