首页|右删失数据下加性风险回归模型的统计推断及变量选择

右删失数据下加性风险回归模型的统计推断及变量选择

李群

右删失数据下加性风险回归模型的统计推断及变量选择

李群1
扫码查看

作者信息

  • 1. 首都经济贸易大学
  • 折叠

摘要

生存分析广泛应用于许多领域,例如,癌症研究、临床试验、流行病学研究、保险精算等。各种生存模型在右删失数据下的研究都已经取得了很大进展。而在实践中,右删失数据往往具有一些复杂的特征,这使得分析研究变得很有挑战。本文研究了相依右删失数据基于限制均值寿命差的疗效比较,右删失数据带有辅助协变量的统计推断以及右删失高维协变量数据的变量选择三部分内容。 第二章研究了带有相依删失的右删失数据基于限制均值寿命的疗效评价问题,以便评估治疗方式是否能够延长寿命。在估计治疗效果时,相依删失和分组非随机都会对结果产生影响。对此,研究中利用了加性风险模型下删失逆概率加权估计方程解决了相依删失的问题,并给出了限制均值寿命差异的估计量,并证明了该差异值的相合性和渐近正态性。模拟结果也说明了该方法具有很好的有限样本性质,并且比不考虑相依删失的估计结果更有效。最后应用到原发性胆汁肝硬化(PBC)数据。 第三章针对协变量数据的复杂特性,研究了具有协变量误差的右删失数据的加性风险模型的估计问题。当真实协变量仅在随机选择的验证集上可以观测到而对应的辅助协变量在全体研究样本中可以观测时,基于加性风险模型建立了非参数修正得分方程进行估计。该估计方程可以处理任意形式的协变量误差,我们还证明了估计量的渐近性质。模拟结果表明,该方法在偏差减少和置信区间覆盖方面表现良好。最后,将所提出的方法应用于原发性胆汁肝硬化问题的研究中。模拟结果和实际结果均表明了本文所提估计比仅使用验证集的估计更加精确并证实了使用辅助信息会提高估计的有效性。 此外,当协变量维度较高时,需要对重要协变量进行选择。第四章研究了右删失数据加性风险模型的变量选择和参数估计问题。本文将自适应岭回归近似L0惩罚回归估计(BAR)应用到右删失数据的加性风险模型中。我们证明了所得估计对于变量选择是相合的,所得参数估计具有oracle性质,对于高度相关协变量有分组效应。同时在模拟中考虑了低维和高维协变量情况,验证了该方法在有限样本中的有效性,并与常见的一些惩罚方法进行对比,结论表明该方法在正确选择非零协变量上有一定优势。最后将该方法应用到PBC数据中进行变量选择和参数估计。

关键词

生存分析/右删失数据/加性风险模型/非参修正方法/变量选择/统计推断

引用本文复制引用

授予学位

博士

学科专业

统计学

导师

张宝学;孙六全

学位年度

2021

学位授予单位

首都经济贸易大学

语种

中文

中图分类号

O1
段落导航相关论文