摘要
本文目的是在大数据框架下,以人工智能算法为工具,建立刻画乡村农户贫困状态的关联特征提取的框架和配套的分析流程.本文结合国内某地真实的数据源为出发点,以“分类与回归树”(CART)分析和吉布斯抽样(Gibbs Sampling)人工智能算法为工具,筛选出刻画乡村农户贫困状态的12个高度关联的特征因子,并针对筛选出的特征因子的甄别能力进行了基于ROC 曲线的AUC 测试.分析结果表明本文建立的筛选框架能够提取出刻画乡村农户贫困状态的特征因子,它们是:1)家庭健康人数少于3人;2)家庭人口少于3人;3)致贫主因_因病;4)致贫主因_缺劳力;5)致贫主因_因残;6)致贫主因_缺资金;7)是否享受农改;8)现居住房屋鉴定等级;9)家庭成员中有人患有25种大病之一;10)再就业方式_专项资金支付岗位补贴;11)再就业方式_灵活就业大于等于2人;和12)农户的教育程度.期待这些刻画农户贫困状态特征因子的建立对国家在乡村振兴持续发展奔小康道路上需要的落地实施的方案设计和配套政策的精准制订等方面起到积极的推进作用.此外,本文建立的从大数据角度结合人工智能算法从关联特征因子的视角来筛选刻画农户贫困状态特征因子的方法与目前(流行)的其它计量分析不同,这种基于大数据进行关联特征筛选的思路和对应的分析流程能够为金融科技在数字金融在针对真实应用场景解决方案的实现路径上提供一个新的思考维度和行动指南;同时,也期待为从2021年开始的持续支持农村振兴计划的成功实现,提供有用的分析工具,相关的解读建议可为配套的落地实施方案的制订提供参考.