首页|基于特征选择和机器学习的员工离职预测方法研究

基于特征选择和机器学习的员工离职预测方法研究

张菁华

基于特征选择和机器学习的员工离职预测方法研究

张菁华1
扫码查看

作者信息

  • 1. 天津师范大学
  • 折叠

摘要

在企业管理活动中,人是最活跃、最积极的构成要素,人员的频繁离职会给公司带来巨大的损失。据报告显示,2022年员工离职率高达17.9%,特别是随着近期疫情的解封,员工离职问题会更加严重,而如何解决这一问题也成为管理者的难题。 在数字经济时代下,企业如果充分利用科学技术预测员工离职动态,提前洞悉员工的离职倾向,就可以帮助人力资源团队更好地作出人才挽留或储备的应对策略,这些对企业的发展具有深远的意义。在员工离职预测领域,目前已经有了大量的研究成果,但是仍旧存在着一些不足,例如在特征选择方面研究方法不多、不深。本文针对其中存在的不足之处,将基于改进遗传算法的特征选择方法和机器学习模型相结合,建立了员工离职预测模型,更好地实现了员工离职的预测。 本文以Datacastle平台的员工离职数据集为研究对象,通过对数据进行预处理,主要包括数据初步处理、数据相关性分析、特征构造、非数值型数据和数值型数据的处理以及不平衡数据的处理等步骤;然后,针对标准遗传算法存在的“早熟收敛”、“搜索迟钝”等问题,提出了一种改进遗传算法,并将标准遗传算法、改进遗传算法应用于特征选择,与选择全部的特征进行对比,在此基础上应用决策树、随机森林、XGBoost、LightGBM四种模型建立员工离职预测模型,分析实验结果发现,改进遗传算法在计算精度上优于全部特征和标准遗传算法,在收敛速度上优于标准遗传算法,且随机森林模型在各条件下表现突出,尤其是基于改进遗传算法的随机森林模型,其平均准确度达到了93.58%;同时,为充分发挥出随机森林模型的全部性能,本文结合网格搜索技术优化了随机森林模型的超参数,将模型准确度提升到了93.86%,进一步提高了员工离职的预测性能;最后,针对工作内容做出归纳总结,提出两点建议,并指出不足与展望。

关键词

员工离职/机器学习/遗传算法/特征选择

引用本文复制引用

授予学位

硕士

学科专业

管理科学与工程

导师

王凡俊

学位年度

2023

学位授予单位

天津师范大学

语种

中文

中图分类号

F2
段落导航相关论文