首页|半监督聚类算法在物流企业客户流失中的应用研究

半监督聚类算法在物流企业客户流失中的应用研究

吴永康

半监督聚类算法在物流企业客户流失中的应用研究

吴永康1
扫码查看

作者信息

  • 1. 东北林业大学
  • 折叠

摘要

最近几年,在物流需求爆炸式增加和行业门槛不断降低的双向推动下,物流行业涌入大量中小型企业,也给客户带来了更多不同的选择。因此,面对激烈的竞争,如何尽可能地减少现有客户的流失是所有物流企业亟待解决的一个问题。 为了解决这个问题,本研究进行了大量的物流企业走访和相关文献研究,发现目前解决客户流失问题的方法主要集中在构建客户流失预测模型,客户流失原因分析以及流失客户挽回策略研究等方面,其中客户流失预测模型是利用企业内部客户基本信息和交易、评价等行为产生的数据来预测出有流失倾向的客户,为企业及时发现此类客户并采取挽回措施提供依据。得益于企业信息化程度的不断提高和数据分析技术的发展,客户流失预测模型是企业和学者的研究重点。但当前客户流失预测模型相关的研究主要集中和停留在提高模型的预测准确度阶段,即尽可能地找出所有存在流失倾向的客户,而没有进一步探究不同客户的流失原因。此外,大部分流失预测模型都把客户流失问题看作有监督分类问题,使用数据和数据标签一起训练分类模型进行预测研究。然而,在实际应用中获得的数据通常只有少量数据具有标签,大量无标签数据无法参与模型训练过程。 基于此,本研究运用可以同时利用少量有标签数据和大量无标签数据所含信息的半监督聚类算法解决无法确定不同客户流失原因和无法充分利用无标签数据提高流失客户聚类准确度的问题。在采用Logistic回归模型将客户划分为流失和非流失两类的基础上,本研究运用半监督聚类算法C-DBSCAN(Density Based Spatial Clustering of Application with Noise and Constraints,基于密度的含噪声和约束应用空间聚类)将流失客户按照相似度聚类到不同簇中,为物流企业确定各个簇中客户流失的具体原因和采取针对性挽回措施提供理论依据。以T物流企业为研究对象进行实例分析,利用企业内部真实数据和上述半监督聚类算法进行的实验结果表明,本研究采用的Logistic回归分析和半监督聚类C-DBSCAN算法组合模型在物流企业客户流失中的应用不仅可以确定不同流失客户群体的具体流失原因,还在与其他方法的对比实验中取得了最佳聚类效果。最后,本研究结合实验结果和T物流企业背景给出针对不同流失客户群体的具体挽回建议。

关键词

物流企业/客户流失/半监督学习/Logistic回归模型

引用本文复制引用

授予学位

硕士

学科专业

林业工程

导师

陶新民

学位年度

2022

学位授予单位

东北林业大学

语种

中文

中图分类号

F2
段落导航相关论文