摘要
水文频率分析通常依据一个计算期内收集的数据进行设计值或重现期外推计算,其计算精度以来用的记录长度。大多数发展中国家,样本长度不会超过50-100年。现行水文频率计算缺乏考虑建模及外推中样本长度充分性的依据。而样本数据既用于估计分布参数,也用于识别模型和评估计算结果,忽略这一因素可能会低估规划及设计的潜在风险。本文以水文频率计算的最小样本长度确定方法为关键科学问题,界定了单变量和多变量水文频率计算框架的最小样本长度概念,研究两种框架下最小样本长度的确定方法,以期为确定水文序列的可外推范围,减小水文设计过程中由于序列长度限制所导致的模型构建及设计成果的认知不确定性。主要工作和研究结果如下: (1)综述国内外水文频率计算、样本长度单变量及多变量水文频率计算样本长度的研究进展。明确样本长度确定的理论价值和实际意义。 (2)系统阐述了单变量频率分布线型、参数估计方法,及Copula函数的定义、水文领域常用Copula函数及其参数估计和优选方法。 (3)基于抽样方法和AIC识别准则识别最优分布线型、Copula函数,并量化在可用数据下识别的不确定性。应用于国内35个典型径流、降水、洪峰序列和国外两个长序列测站的洪水数据,并进行数值模拟实验,分析了样本长度对分布线型及Copula函数的识别影响。 (4)在识别出最优分布线型的基础上,引入极大似然估计量的渐近正态性质,提出单变量框架水文频率计算的最小样本长度概念,将bootstrap方法与Shapiro-Wilk正态性检验相结合,提出最小样本长度的确定方法。应用于国内35个典型径流、降水和洪峰序列,确定不同重现期水文频率计算所需的最小样本长度,对实例计算结果进行方差分析(ANOVA)检验。在此基础上,选用相对置信区间(RCI)、平均相对误差(RMAE)为评定误差指标,应用曲线拟合法,定量分析不同参数、频率、参数估计方法与样本长度间的潜在关系。 (5)提出Copula联合概率分布模型的最小样本长度分析框架,采用抽样算法结合两阶段极大似然估计法AIC准则识别最优边缘分布函数及Copula函数,基于两阶段极大似然估计量的渐近正态性质,界定了两变量重现期计算的最小样本长度概念,将bootstrap方法与Shapiro-Wilk正态性检验相结合,提出最小样本长度的确定方法。选取国外两个长序列站点的洪水资料计算Copula联合概率分布模型两变量重现期计算的最小样本长度,确定两变量重现期的可计算范围。为了验证了方法的可行性,进行数值模拟分析,结果表明,本文的方法是正确的。 (6)对比单变量水文频率计算和Copula的两变量水文频率计算的最小样本长度结果,可以发现从单变量到多变量的转换,对样本长度的需求急剧增加。文中最小样本长度的分析方法能很好地捕捉到单变量与多变量,以及不同量级设计值组合的同现重现期,联合重现期对样本长度的需求差异。 本文提出的方法量化了模型构建过程中的不确定性,给出了最小样本长度确定的数理统计依据,为水文频率计算中样本长度的分析提供了思路,以期为提高水文设计值成果的可靠性等提供支撑。