摘要
作为社会管理和公共服务的提供部门,政府在收集数据、使用数据时有着得天独厚的优势,业务数据成为政府部门海量数据的来源。为了提高政府部门监督管理水平的科学化,有必要加强对现有业务数据的科学整理和利用。本文以电子政务实施的成功案例——昆明市质量技术监督局在用的《基层质量技术监督管理信息系统》内企业质量信息为原始公共数据库,探讨对现有企业质量信用信息进行数据挖掘和数据分析,如何剔除重复数据和无用数据。采用最小数据集与质量信用信息相结合的思维模式,利用R语言使用随机森林算法,对最小数据集候选因子关于企业质量信用评级结果重要性进行选择,再通过逻辑论证形成企业质量信用管理最小数据集,以及对企业质量信用最小数据集的评级指标做相关性分析。研究结论显示存在五个质量信用因子对企业质量信用的评级具有稳定的重要影响。