首页|大数据条件下虚开发票风险识别研究

大数据条件下虚开发票风险识别研究

宋志淼

大数据条件下虚开发票风险识别研究

宋志淼1
扫码查看

作者信息

  • 1. 内蒙古财经大学
  • 折叠

摘要

伴随着现代信息技术的不断发展和我国全面深化改革的不断推进,税收环境也发生了长远的变化,大数据技术在税收风险管理的重要作用越来越突出。2014年9月国税总局印发了《关于加强税收风险管理工作的意见》,明确提出要以风险管理为导向,利用大数据、人工智能等现代信息技术工具提高税收管理决策水平和强化对税收征管的有效监测,从而提升税收风险管理的科学性、精准性和规范性。虚开发票风险识别是税收风险管理的重点领域,随着金税三期的全面推广和金税四期的逐步实施,充分利用纳税人提供的纳税申报表和财务数据来进行发票风险识别成为防范虚开发票风险的重要举措。因为企业财务数据是根据大致相同的会计准则编制的,企业的生产经营数据是通过较共性的会计政策反映出的,是计算税收的主要经济基础数据,通过海量的企业财务数据收集分析,能够对企业的经营行为进行精准画像,为提高对发票的实时、全面和有效管理提供了有利条件。随机森林算法是大数据技术的典型技术之一,是随机森林算法体系的重要组成部分。运用随机森林算法技术设计并训练识别模型,可以深入分析和处理收集整理的税收大数据,进而分析整个样本的相关性,消除人为干扰,预测应纳税额,并与企业实际申报的应纳税额进行比较,进而能够有效的识别虚开发票风险,增强税收风险管理效率,提高打击恶意逃避税行为,营造良好的营商环境,提高纳税遵从度和税收征管效能,为建设社会主义现代化强国和经济高质量发展提供有力支撑。 当前基于财务数据和纳税人申报等基础大数据,利用随机森林进行虚开发票风险识别的研究很少。本论文基于虚开发票风险理论和随机森林算法理论,研究分析了随机森林算法在A省税务局虚开发票风险识别的应用,按照数据挖掘流程对模型的应用进行分析,实现了对虚开发票风险的量化衡量,同时提出运用大数据及其随机森林算法进行虚开发票风险识别过程中存在的问题,并进一步提出了改进运用大数据及其随机森林算法提高虚开发票风险识别效率的政策建议。

关键词

虚开发票/风险识别/随机森林/大数据

引用本文复制引用

授予学位

硕士

学科专业

税务

导师

刘志安

学位年度

2022

学位授予单位

内蒙古财经大学

语种

中文

中图分类号

F8
段落导航相关论文