摘要
时间序列数据分析是数据挖掘的一个重要方向.水文数据中存在着大量的时间序列,如:降雨、水位、流量、气温等的记录集.随着数据采集的自动化,数据变得规则化、规模化,这些数据的表面价值早已不言而喻,而如何更有效地发掘和利用这些大量数据背后隐藏的可用信息已经开始引起研究人员的重视,尤其是随着计算机技术、数据库技术的发展、海量数据的出现,更使得这种研究具有价值.然而,与数据采集和存储技术飞速发展不相称的是知识获取技术进展的缓慢,知识的自动获取已经成为制约发展的"瓶颈".这种情况下,数据挖掘应运而生.水文时间序列的研究和应用主要包括:相似性查询(大序列研究)、趋势分析、周期性分析、挖掘时段模式等,传统的水文学主要应用统计学的方法来分析;从数据挖掘的角度对时间序列的研究是近年来兴起的一个领域,它既有和统计学相似的一面,同时也存在着很大的不同.目前,国内外研究人员采用不同的方法围绕时间序列进行的研究己取得了一定的成果;尽管这些研究还没有形成统一、完善的理论和方法,尤其是在水文学方面的实际应用更有待探索,但数据挖掘将数据变为知识和信息,从数据矿山中找到蕴藏的知识金块,将为知识创新和知识经济的发展作出贡献,作为一种尝试,其意义是不容置疑.该文在综合分析数据挖掘在水文学方面的应用后,着重对相似性查询,也就是在数据集中发现频繁集的过程进行了研究探讨,并结合广东部分水文数据进行和实际验证.对水文数据进行分析研究,发现水文时间序列中蕴藏的有用信息,有利于掌握水文数据变化规律和趋势,在工程规划、洪水预报、防洪调度等方面都有重要的现实意义.