首页|基于混合数据贝叶斯网的课程关系分析

基于混合数据贝叶斯网的课程关系分析

朱梓源

基于混合数据贝叶斯网的课程关系分析

朱梓源1
扫码查看

作者信息

  • 1. 长春工业大学
  • 折叠

摘要

贝叶斯网是用来描述随机变量间依赖关系的有向无环图(DirectedAcyclicGraph,DAG)模型。贝叶斯网的研究主要包括参数学习和结构学习两部分。其中结构学习是指从观测数据出发,发现变量之间的依赖关系,学习DAG结构,本质上为统计学中的模型选择问题。本文考虑同时含有有序变量和高斯变量的混合变量情形下的贝叶斯网结构学习问题。 本文首先假设有序变量是由高斯潜变量截断而得到的,进一步假设高斯潜变量和观测到的高斯变量联合分布为高斯分布,并且该分布蕴含的条件独立关系可由DAG表示,进而提出含有有序变量和高斯变量的混合变量情形下的潜在高斯DAG模型。并且,本文基于结构EM(SEM)算法,提出了含有有序变量和高斯变量的混合变量情形下的贝叶斯网结构学习算法,即MSEM算法。MSEM算法共分为三步,分别为初始化、E步和M步。初始化给出算法迭代的初值,包括初始的DAG和相应的参数;E步计算当前参数下,候选DAG模型的期望对数似然;M步求使得惩罚期望对数似然最优的DAG结构,并得到最优DAG结构对应的参数。MSEM算法迭代E步和M步直至收敛。由于E步涉及高维数值积分,因而本文从潜变量的后验分布,即截断正态分布中抽样,采用MCEM算法近似计算E步。 我们通过模拟实验比较MSEM算法与CPC、MMPC、OPC算法在处理含有有序数据和高斯数据的混合数据的贝叶斯网结构学习问题中的性能。根据模拟结果我们发现,MSEM算法在不同变量个数、不同样本量下均优于其他算法的结果。我们应用MSEM算法分析某高校统计学专业某年级学生22门课程的考试成绩,进而探究得出各门课程间的内在联系。

关键词

贝叶斯网络/结构学习/混合数据/EM算法/课程关系

引用本文复制引用

授予学位

硕士

学科专业

统计学

导师

徐平峰

学位年度

2023

学位授予单位

长春工业大学

语种

中文

中图分类号

C8
段落导航相关论文