摘要
消费是经济稳定增长的“压舱石”,是拉动经济增长的“三驾马车”之一,而消费金融则是释放内需潜力,促进居民消费的重要抓手。基于消费金融的重要意义,各类金融机构也开始积极地拓展消费金融业务以促进消费市场的发展和满足消费需求的变化。 在当今大数据时代背景下,互联网消费金融业务凭借其高效、精准、实时、低成本等优点快速成长,但在迅速发展的同时也涌现出不少风险和挑战。由于互联网相关业务都是通过线上处理,具有不透明性,同时个人征信系统也存在不完善的情况,借款人的信用风险较高,因此提高信贷风控模型的预测能力成为构建信贷风控体系的重点。从用户的行为数据提取复杂的交互特征,以便挖掘出更多有效信息是提升预测效果的关键。用户特征一般是高维且稀疏的,特征之间的组合关系并不明显,传统的信贷模型无法通过算法实现特征之间的自动组合,需要在特征工程阶段根据经验手动构造交互特征,但是手动构造复杂的交互特征不仅需要消耗大量的人力且不能保证构造出的特征的有效性。 最初被应用于点击率预估的 DeepFM 模型能够通过模型特性自动进行特征交互。但是,该模型存在低阶交互特征提取不够完备且只能学习隐式的高阶特征组合等问题。本文在DeepFM模型的基础上进行改进并提出了AMDFM模型,相比DeepFM,该模型在提取低阶特征交互时引入了注意力机制来学习不同组合特征的权重,在高阶特征交互方面引入多头自注意力机制模块,使模型不仅可以学习隐式的高阶特征组合,还可以学习显式的高阶特征组合,提高了模型的预测能力。本文主要基于 Lending Club 数据集,对提出的AMDFM 模型进行实证研究。从模型超参数影响、模型性能、模型可解释性以及特征交互层模块消融实验等多个方面证明本文所提模型的有效性。 综上,本文构建了一种基于改进 DeepFM 的信贷风控模型。根据挖掘交互特征的思想,通过在模型的特征交互层,引入传统注意力机制改进低阶特征交互模块,引入多头自注意力机制丰富高阶特征提取,增强了模型对于交互特征的学习能力,使模型获得了更好的预测性能。