摘要
随着资本市场的不断发展,国内外上市公司财务舞弊案件频繁发生,给广大投资者和股票市场带来了严重损失和危害。为了促进市场经济的健康发展,建立一个有效的财务舞弊识别模型具有重要意义。利用机器学习的各种算法建立模型,可以高效地对样本进行分类、洞察数据间的关系,并及时识别上市公司的财务舞弊行为。 本文首先介绍了财务舞弊的相关理论,总结了机器学习的分类和算法;随后选择了2010-2023年曾被证监会、沪深交易所等机构处罚的中国上市舞弊公司作为初始样本,经过时间和行业的筛选,确定了信息传输、软件和信息技术服务业的40家财务舞弊的上市公司为舞弊样本,然后以同时期、同行业等条件选取了等量的非舞弊公司为配对样本。接着根据舞弊三角理论和以往学者的研究成果构建了财务舞弊识别模型的指标体系;之后利用支持向量机、BP神经网络、逻辑回归分别构建了上市公司财务舞弊识别模型,并对上述模型进行了评估比较;最后选择了表现较佳的支持向量机模型进行了特征重要性分析。 同时,本文选择了罗普特科技集团股份有限公司为舞弊案例,进行了舞弊案件的回顾、舞弊手段及成因的分析,并将其相关数据代入上述模型进行验证,并对比了特征重要性分析的结论是否在案例中有所体现。结果表明以支持向量机算法建立的模型效果较佳。 本文以信息传输、软件和信息技术服务业的上市公司样本为例,基于机器学习并结合案例分析的方法构建了上市公司财务舞弊识别模型,这一研究方法丰富了财务舞弊的理论研究,在大数据时代为财务舞弊识别提供了更为有效的手段,并对投资者、监管机构和证券市场等都起到了一定的积极作用。