首页|基于机器学习的农村地区创业成功人群识别

基于机器学习的农村地区创业成功人群识别

戴承瑛子

基于机器学习的农村地区创业成功人群识别

戴承瑛子1
扫码查看

作者信息

  • 1. 重庆理工大学
  • 折叠

摘要

为了全面实施乡村振兴战略,加快城乡间融合发展的步伐,尽快实现乡村产业的发展和农村地区人才振兴,在党中央“大众创新,万众创业“的基调下,农村地区返乡创业现象呈现一股热潮,并在将来可预见的一段时间内呈现愈演愈烈的趋势。在党的十九届五中全会上强调推进农村农业现代化发展,实现产业兴旺、生态宜居、乡风文明、治理有效、生活富裕的总要求,返乡创业成为提高农村地区就业率,改善农村地区人口福祉甚至维护社会稳定发展的重要手段。不止于时代背景和理论基础,如何实现农村地区创业成功人群的分类识别具有一定的现实意义和理论意义。 本文利用网络爬虫技术抓取互联网创业案例,对其中创业者特质进行整合,使用R语言对数据进行预处理和特征工程,并使用封装的Boruta算法对特征变量进行筛选,建立农村地区创业人群特征变量表格。接着在R语言环境中建立支持向量机、BP神经网络和随机森林三种机器学习模型,基于该特征变量体系进行训练模拟,对农村地区创业成功人群进行训练与测试。最终采取统一的评价指标进行识别效果的评价,评价指标包括准确率(Accurucy),Kappa系数、特异度(Specificity)、召回率(Recall)、精准度(Precision)、AUC值和P-R曲线。 本文在实证过程中,首先对数据进行预处理和特征工程,建立农村地区创业成功人群识别的特征坐标体系包含是否得到技术支持、创业形式、是否雇佣贫困人员、婚姻状况、是否接受金融支持、年龄、地域、创业动机、是否获得政策支持、性别、创业行业十个特征遍变量,并使用随机森林模型对变量的重要性进行预测。实证过程证明,在机器学习分类识别中,该特征指标体系能够为机器学习提供较准确的分类依据,提供金融支持的机构能够参考该指标体系从而规避风险。不仅如此,该特征指标体系有利于相关机构提前干预地区创业人群,满足地区有意进行创业人群的创业需求,培养相关创业人才所具有的特质,做好地区创业人才储备的工作。 其次,立足于能够尽可能识别更多创业成功人群,并针对该类人群特征精准制定创业相关政策的角度。通过创业者特质来对有可能创业成功的人群进行分类识别进而提供相应扶持是本文研究主要目的,从该要求来看,首先关注的是创业成功人群识别的精准率,此时多项式核SVM应用效果更好。 最后,从整体样本识别准确率和模型稳定性角度来看,随机森林模型对农村地区创业成功人群的识别效果更好。随机森林模型在未知数据测试集中表现出较高的准确率,且面对不平衡数据时,随机森林Kappa值更高,说明随机森林模型能够更好的应对数据的不平衡性,并能在未知数据中找出非线性规律从而对数据进行分类。

关键词

农村地区/创业成功人群/识别模型/乡村振兴战略

引用本文复制引用

授予学位

硕士

学科专业

技术经济及管理

导师

邝坦励

学位年度

2022

学位授予单位

重庆理工大学

语种

中文

中图分类号

F3
段落导航相关论文