首页|缺失偏正态众数混合专家模型的参数估计及贝叶斯分析

缺失偏正态众数混合专家模型的参数估计及贝叶斯分析

鲁钰

缺失偏正态众数混合专家模型的参数估计及贝叶斯分析

鲁钰1
扫码查看

作者信息

  • 1. 昆明理工大学
  • 折叠

摘要

在分析金融、医疗、社会科学和环境科学等许多领域的实际数据时,基于同质总体和正态误差的假设,无法识别数据的偏斜特征和异质性.一方面,忽略数据的异质性,往往造成欠拟合,导致模型的预测能力不足.混合专家(Mixture of Experts,MoE)作为统计学和机器学习领域的一个流行框架,常用于对数据中的异质性进行建模以进行回归、分类和聚类,更能准确地捕捉数据集的不同特征.另一方面,忽略数据的偏斜特征,造成信息的损失.若假设数据服从正态分布等对称分布,在实际应用中不能很好地捕捉数据的偏度.需注意的是,由于数据表现出偏斜的特点,相比于均值和中位数,众数作为“最多水平”的标志值能更好地刻画数据集中的趋势,且不受异常观测的影响,能保证其稳健性.最后,在数据管理等诸多领域中,不可避免地会出现缺失数据.在统计建模中,若忽略该问题将丢失大量的有用信息,甚至建模过程陷入混乱,导致输出不可靠的结果.同时在实际应用中有部分统计问题可以转换为缺失的特殊情况,例如在贝叶斯分析中,考虑潜变量本质上是缺失的特殊情况.因此,本文提出缺失偏正态众数混合专家模型,从似然和贝叶斯角度分别研究了该模型的估计.具体地,本文开展的研究工作如下: 第一,本文研究了在响应变量随机缺失下的偏正态众数混合专家模型的参数估计.提出了一种基于众数回归插补和聚类的分层众数回归插补方法,通过模拟实验,进一步比较研究当下热门的三种机器学习插补方法(支持向量机插补、随机森林插补和BP神经网络插补)与三种统计学插补方法(分层均值插补、众数回归插补和分层众数回归插补)的缺失数据处理效果.最后,通过上海空气指数(AQI)的实际数据,研究了完全数据和缺失数据下的偏正态众数混合专家的参数估计方法,说明了分层众数回归插补方法的实用性. 第二,本文构建了贝叶斯框架下的偏正态众数混合专家模型.通过将混合偏正态分层表示,利用独立性来简化计算并提高效率,构建了分层贝叶斯模型.采用Gibbs抽样算法和M-H算法的混合抽样算法,并通过模拟表明了该模型在给定不同先验信息下的稳健性,由于提出的模型包含正态混合专家的特殊情况,结果显示,当偏度较大时,提出的模型在处理偏斜数据时,比正态混合专家具有更好的数值表现.最后,通过房地产行业的实际数据,说明了该方法的实用性以及可行性.

关键词

混合专家模型/偏正态众数缺失/参数估计/分层众数回归插补/贝叶斯分析

引用本文复制引用

授予学位

硕士

学科专业

系统理论

导师

吴刘仓

学位年度

2023

学位授予单位

昆明理工大学

语种

中文

中图分类号

O1
段落导航相关论文