摘要
对疾病时空数据的探索,可以为疾病监控和预防提供理论指导,帮助我们了解疾病在地理时空中的分布和变化规律。层次贝叶斯模型为了能够更好地发掘时空数据所蕴藏的规律已经开发出许多扩展模型,通过集成嵌套拉普拉斯近似方法(INLA)的推断,层次贝叶斯模型在分析疾病风险方面往往有很好的表现效果。 本文在集成嵌套拉普拉斯近似方法的基础上,研究不同的层次贝叶斯模型对于白血病患病风险的拟合效果,通过理论分析、模型建立与推断及模型对比等对白血病的发病风险状况进行了研究。 本文首先在原始数据的基础上直接计算各地区的预期患病数量,通过观察值与预期值之比粗略估计原始数据对于患病风险的展现效果。在模型建立方面,将泊松回归模型加入随机效应以对比不同,建立内条件自回归模型观察邻接区域对白血病患病风险的影响效果。通过 AR 模型单独分析区域内时间效应的影响之后,将随机效应与邻接区域效应相结合建立 BYM 模型与 Leroux 模型,最后采用空间滞后模型来反映周边区域上一个时期的患病情况对其影响。 本文选取的模型满足潜高斯模型,因此在模型参数方面采用集成嵌套拉普拉斯近似方法进行推断估计,在得到推断结果后将各个模型对于白血病患病风险的拟合情况进行可视化。 由于层次贝叶斯模型的有效参数数量通常难以确定,导致常见的两类贝叶斯评价准则 AIC 与 BIC 对于层次贝叶斯模型的评价效果不佳,因此本文选择 DIC 与WAIC 评价准则对模型结果进行评估,并对比分析各模型对于白血病患病风险分布情况的图像差异及拟合效果。