摘要
分别使用传统统计学方法与机器学习方法对北京市空气质量状况展开实证分析,研究"判别分析""决策树""支持向量机"和"随机森林"四种分类方法对于同一数据集的分类结果.为了研究该问题,首先对传统分类方法构建的判别分析分类器与机器学习分类方法构建的三类分类器进行了理论介绍,随后以4:1的比例将北京市空气质量状况数据分为训练集与测试集,使用训练集构建分类器,对构建的分类器进行优化处理后,使用测试集进行分析及预测,根据预测结果对传统分类方法与机器学习分类方法进行详细实证对比和评价.采用传统分类方法与机器学习分类方法分别构建数据分类器,并应用于空气质量数据的统计和分析中,可为其他周期以及其他地区的空气质量研究提供方法支持,也可为类似数据的有效分类提供技术指导.
基金项目
山东省自然科学基金(ZR2016FM45)
山东省社会科学规划研究项目(19CZKJ08)
山东省研究生教育优质课程(SDYKC18079)
山东省研究生教育创新计划项目(SDYY16092)
曲阜师范大学交叉学科研究项目(XKJJC201901)