摘要
整数值时间序列的广泛存在性吸引了众多学者的探究,过度离散(方差大于均值)是此类数据中的常见现象之一, 且导致过度离散的主要原因有数据的零膨胀, 重尾以及波动大等. 由于最早的一阶整数值自回归模型 (First-Order Integer-Valued Autore-gressive, INAR(1))——泊松INAR(1)模型,不适于拟合过度离散型数据,所以对经典模型的改进成为许多研究者的方向. 常用的模型改进方法主要有两种, 一种是通过改变新息量的分布增强模型的适应性, 另一种是通过改变模型中的稀疏算子扩展模型.本文针对 INAR 模型, 提出了两类拟合过度离散型数据的模型, 其中一个是通过改变新息量分布,提出了一个具有单参数新息的INAR(1)模型,另一个通过使用两种稀疏算子, 提出了一阶和高阶的混合广义泊松 INAR 模型. 此外, 本文还考虑了一个检验INAR(1)模型中零修正的直观方法. 文章的具体内容由如下的三个部分构成: 1,具有单参数新息分布的INAR(1)模型. 为了解决泊松 INAR(1) 模型不适于拟合过度离散型数据的问题, 许多学者提出了各种各样的可用于过度离散型数据的INAR模型. 但是,这些模型的新息分布大多是泊松分布的衍生分布,例如零膨胀泊松、复合泊松、双重泊松及广义泊松分布等,且这些分布的参数通常不止一个. 近年来, 一个新型的单参数的Bell分布被提出. 该分布不仅是单参数且形式简单的分布, 还隶属于指数族分布. 另外, Bell 分布的方差是大于均值的, 表明其适合被用来拟合过度离散型数据. 因此, 本文将 Bell 分布用在整数值时间序列中,介绍了一个由二项稀疏算子构成的INAR(1)模型. 文中讨论了该模型的基本性质, 且模型参数分别由条件最小二乘、Yule-Walker 以及条件极大似然三种方法给出, 并讨论了三种估计方法的相合性和渐近正态性. 随后, 本文通过数值模拟分析了三种估计方法的表现. 最后, 为观察所提出的模型是否具有优势, 本文利用两个实际数据例子进行分析比较,结果表明所提出的模型相较其他模型是具有竞争力的. 2,混合广义泊松INAR(p)模型. 在 INAR 模型中, 稀疏算子起着非常重要的作用, 它决定了模型中变量的生成过程. 经典的泊松 INAR(1) 模型中使用的是二项稀疏算子, 即伯努利过程. 然而实际中有些情况下, 数据的生成过程不是一成不变的. 所以单一过程的模型在某些情况下可能是不合适的, 因此混合 INAR 模型便成为了更佳的选择. 混合 INAR 模型的一个非常有吸引力的特性是它可以捕捉时间序列过程中的结构性变化. 但是现有的混合INAR模型大多是将二项稀疏算子与负二项稀疏算子进行混合. 本文为拟合具有结构变化的过度离散型数据, 基于拟二项稀疏算子和广义泊松稀疏算子, 提出了一个具有广义泊松新息的混合 INAR 模型, 并分别建立了该模型的一阶和高阶形式. 另外, 本文给出了两种模型平稳性和遍历性的证明, 通过条件极大似然方法进行参数估计, 并且数值模拟结果表明该估计方法是有效的. 同时, 本文对模型的预测进行了讨论, 并通过数值模拟对预测的效果进行了评估. 此外, 为避免高阶模型的定阶问题, 本文介绍了一个贝叶斯模型平均的预测方法. 最后,通过两个实例分析,与其他模型相比,混合广义泊松INAR(p)模型的优势得到了展示. 3, INAR(1)模型零修正检验的一种直观方法. 对于整数值时间序列而言, 导致其过度离散现象的原因之一是零膨胀 (zero in-lfation), 即数据中零出现的频率比泊松分布中零出现的概率大, 反之, 则称为零收缩(zero delfation). 因此, 检验一个数据集中零的数目是零膨胀还是零收缩是十分必要的, 这为后续模型选取起到了至关重要的作用. 事实上, 目前也有许多方法可以用于检验零修正, 例如似然比检验, 得分检验和零指数检验等. 但是现有检验都依赖于渐近的结果, 从而对于样本量较小的数据可能失效. 本文则为 INAR(1) 模型的零修正检验提供了一个不依赖渐近结果的直观检验方法,该方法以数据中零的个数为检验统计量,给定统计量分布近似为Beta二项分布,并给出了均值参数估计的一个修正. 通过数值模拟以及与零指数检验的对比,结果表明本文所提出的方法可以相对较好地控制犯第一类错误的概率, 另外在给定的备择假设下, 检验的功效也与零指数检验类似.最后,本文通过三个实例对检验方法进行了验证.