摘要
小企业在中国经济中扮演着非常重要的角色,不仅是就业市场的主要提供者,还能够带动投资和促进消费。因此,加大财政和金融领域对中小企业的支持力度,特别是解决融资问题,有助于增强中国经济的发展活力。但是,中小企业面临的一个主要问题是融资难,这主要是由于它们的抗风险能力较弱,容易发生违约。所以如何准确地判断小企业是否处于违约状态,已成为当前需要解决的紧迫问题。 针对此问题,本研究致力于构建一种基于最优指标组合与训练样本的小企业违约风险判别模型,以实现对小企业违约状态的精准判别,规避潜在的违约风险。 具体的,围绕着构建“基于最优指标组合与训练样本的小企业违约风险判别模型”的研究目标,本文梳理出如下两个科学问题:(1)如何遴选出违约鉴别能力最强的指标组合。不同的指标组合对同一个企业的违约概率判别结果不同,甚至截然相反,因此需要寻找一组最优的指标,以使违约判别模型的能力最大化,进而最大限度地区分出违约客户和非违约客户。(2)如何选择最优的训练样本。在构建违约风险判别模型时,任何一个模型或方法都对训练样本有着很强的依赖性,因此选择一个最优的训练样本构建模型是一个具有挑战性的问题。相应的,本文的主要研究内容如下: 首先,针对问题(1),本研究对同一个训练样本进行随机有放回抽样100次得到100个训练子样本,对100个训练子样本运用Lasso回归得到了100个单一样本的最优指标组合,在这100个最优指标组合中统计第r个指标出现的频率fr。给定一个频率阈值,将频率fr大于等于阈值的指标保留,得到一个指标组合,给定频率阈值0.01,0.02,...,1,由此构造了由频率大于等于阈值的指标构成的多个指标组合Sr;对于多个指标组合Sr,以综合判别精度AUC最大为标准,反推确定出一个最优的指标组合。小企业实证研究表明,“资产负债率”,“抵质押得分”,“近三年企业授信情况”等45个指标组成的指标体系的违约风险判别精度最高。 其次,针对问题(2),本研究通过训练样本构建模逻辑回归模型后,把验证样本中误判的所有客户构成一个误判样本,对误判样本中一定数量的客户进行多次有放回抽样、放回训练样本后形成多个新的训练样本,对多个新的训练样本建模后得到多个验证精度G-mean,由此得到G-mean最大的那个最优的训练样本,提高了判别模型的精度。小企业实证研究表明,当取误判客户数量与原训练样本中的客户数量为8:70时,违约风险判别模型的违约风险判别精度最高,且第二类错判率更低。