摘要
由于国内外经济互联网金融市场的迅速发展,加上民众生活水平的逐步改善以及人们消费观念的提升,信贷也开始成为了人类进行社会经营生活的主要组成部分。从人们消费理想的视角出发,在国外盛行的“超前消费”观点也开始兴起,由储蓄型逐步向消耗型过渡,不管从信贷组织、信贷业务、还是信贷形态上,均呈多样化的发展趋势。近年来,随着汽车贷款、教育贷款、小额贷款等在不同行业兴起。以及二十一世纪初互联网的异军突起,给不同产业都造成了很大的打击与挑战,但随之而来的又有了全新的发展机会。互联网对信贷业务产生的最大的影响就是可以借助互联网的优势,不论身处何地都能通过网络完成贷款的申请、审核、借贷、还款等等一系列操作,但于此同时,在网络的虚拟世界中进行交易存在许多信用问题和欺诈风险。与国外不同,国内的信贷风险评估体系和风险管理系统仍处于发展和不断完善的阶段。此外,新冠肺炎疫情带来的经济上的冲击、全球金融下行压力增大等等因素,都增加了信贷的风险。 当前国内外对于信贷的研究主要集中在三个方面。一是对信贷的规范和监管体系的探究,试图探索出更为有效的政策措施。二是从降低信贷风险的角度出发,挖掘出影响信用水平的有效特征。最初这些特征都以用户提供或其他渠道收集到的财务信息,但随着获取数据技术能力的不断发展以及评估体系的多元化,个人财务提供的信息十分有限,近期的研究方向更多的转向社会关系、历史行为、相关的文本信息,这些“软信息”能从不同的方面弥补财务信息的不足,充分利用这些信息可以在一定程度上缓解尤其是网络上的信贷交易存在的信息不对称的局面。三是利用模型预测信贷违约,比较主流的方法有logistic模型,其次是支持向量机、树模型、集成学习、神经网络等,将信贷违约问题简化成二分类模型的概率预测。 本文以网络借贷平台Prosper数据集为例,在网络信贷的背景下建立一个可以预测违约风险、同时也能预测违约发生时间点的模型。若能在预测违约风险的同时也预测出违约发生的时间,可以帮助金融机构确定合适的贷款期限。首先出于模型的可解释性考虑,本文建立了Logistic+生存分析+Lasso的混合治愈率模型,同时对比了Logistic模型、加入生存函数的混合治愈率模型、加入L1正则化惩罚的混合治愈率模型等,从AUC的角度解释了混合治愈率模型预测违约概率的有效性,以及从不同样本的生存概率解释了混合治愈率模型预测生存时间的有效性,并指出对于违约风险预测和违约时间点预测所需的重要变量是不完全重合、甚至存在较大差异。其次,本文在舍弃模型可解释性的情况下用XGBoost作为违约风险预测模型,从AUC的角度说明了XGBoost+生存分析+Lasso的混合治愈率模型预测效果更好。