摘要
目前,中国艾滋病流行形势依然严峻,防治工作中新老问题和难点问题并存,防治任务艰巨。因此,利用中国以往的艾滋病数据,分析中国艾滋病的流行特征和空间分布特征,并建立预测模型,对中国艾滋病防控工作有重要的参考意义。 本文首先基于空间自相关分析方法,从全局和局部两个角度探究中国艾滋病的空间聚集特征和时空演变规律。其次,采用基于艾滋病时间序列特征的聚类分析方法,分析中国艾滋病的不同发病模式及其空间分布特征。再次,利用时差相关分析方法,确立具有同步和先行性质的百度指数。最后,依次采用多元线性回归模型、BP神经网络模型以及XGBoost模型,分别建立关于艾滋病发病预测的实时监测模型和先行1年预测模型,并依据评价指标对所建立模型的性能进行对比分析。 本文研究表明:一、从全局来看,2005-2007年间中国艾滋病的发病率和死亡率均无显著空间相关性,2008年后中国艾滋病的发病率和死亡率开始具有空间正相关性,2008-2021年间这种空间相关性越来越强。二、从局部来看,2010-2020年间,中国艾滋病发病率和死亡率均表现为局部空间聚集性越来越强。西南部地区的云南省、贵州省等省份呈现“高-高”聚集特征,东部和东北部的辽宁省、山东省等省份呈现“低-低”聚集特征。三、中国艾滋病的发病模式有四类,并且四种发病模式具有显著的空间聚集特征。第一类发病模式主要分布在中国的中东省份,第二类发病模式主要分布在中国的北部省份,第三类发病模式多出现在中国的中部省份,而第四类发病模式主要分布在中国的西部省份。四、基于百度指数建立的三种同步预测模型和三种先行1年预测模型,XGboost模型的预测性能均是最优的,BP神经网络模型次之,多元回归模型效果略差;且多元线性回归模型、BP神经网络模型以及XGBoost模型三种模型的同步预测效果均优于先行1年预测的效果。