首页|高维区间删失数据下比例风险模型的贝叶斯变量选择

高维区间删失数据下比例风险模型的贝叶斯变量选择

田闯

高维区间删失数据下比例风险模型的贝叶斯变量选择

田闯1
扫码查看

作者信息

  • 1. 长春工业大学
  • 折叠

摘要

在临床医学、生物学、经济学、保险学和人口统计学等领域中,经常遇到删失数据。由于观测对象加入试验、退出试验的时间不一致或者中途因私退出导致的差别、观测时间的局限和客观条件的限制等,人们通常不能观测到感兴趣事件的具体发生时间,若其发生在某一确定的时间段内,则这样的数据称之为区间删失数据。近年来,高维生存数据的变量选择备受关注,而基于贝叶斯理论的变量选择是该领域最炙手可热的方法之一,十分具有研究意义。 第一部分主要研究了Ⅰ型区间删失数据下比例风险模型的贝叶斯变量选择。首先以单调样条函数和Poisson过程数据扩增来构造贝叶斯比例风险模型,并使用Gibbs抽样方法进行后验分布的计算。数值模拟结果表明,在样本量提升的情况下,参数估计效果显著提升。在贝叶斯变量选择中,构造spike-and-slab先验,运用二元潜变量标记活跃协变量,给出满条件分布及相应的Gibbs抽样算法。本文利用潜变量的后验概率来识别活跃协变量,与Lasso、SCAD和ALasso方法对比,贝叶斯变量选择结果的正确率更高。最后,将提出的方法应用到Ⅱ型糖尿病患者心脏衰竭的实证分析中,选择出患者心脏衰竭的影响因素。 第二部分主要研究了Ⅱ型区间删失数据下比例风险模型的贝叶斯变量选择。其主要方法与第一部分类似,在数值模拟中,本文进行了不同协变量维数、不同样本量、不同样条节点和不同超参数选择的模拟设置,展示了所提出方法的优越性。实证分析选取1989年比利时的纵向牙科数据,研究46号恒磨牙状况的影响因素,验证模型方法的有效性。

关键词

高维区间删失数据/比例风险模型/变量选择/贝叶斯理论

引用本文复制引用

授予学位

硕士

学科专业

应用统计

导师

李纯净/蒋志伟

学位年度

2022

学位授予单位

长春工业大学

语种

中文

中图分类号

TP
段落导航相关论文