摘要
群居的昆虫具有很好的群体智能,蚁群算法正是从此仿生学的机理中受到启发而提出的一种进化算法或元启发(metaheuristic)算法。它可以很好地解决并优化许多复杂的问题,得到了广泛的应用。本文主要研究应用蚁群算法解决数据挖掘领域中的分类问题。介绍了蚁群算法求解问题的优越性,分析了当前国内外在数据挖掘分类任务解决上的各种算法,从而提出了利用蚁群算法的特点来解决数据挖掘中分类问题的有效方法。 对于分类问题,文章分析了当前存在的不同的分类方法,如基于决策树归纳分类的ID3和C4.5算法、基于人工神经网络分类的BP算法、基于统计的贝叶斯分类方法,以及基于蚁群算法的分类模型及算法如Ant-Miner等等。这些都是针对分类规则的提取来解决数据库中数据集分类问题的,针对分类问题的特点和蚁群算法的正反馈特点,提出了分类规则的自适应的挖掘模型及算法ACR。算法中设计了合理的蚂蚁选择属性及属性分区的概率公式,以及对规则质量的衡量等策略的改进,可以较好的挖掘分类规则。对标准数据库的测试显示出,ACR算法可以得到比C4.5算法和Ant-Miner算法更好的规则质量。 本文研究了蚁群算法在数据挖掘领域中的应用,涉及了解决分类问题的蚁群算法,拓展了蚁群算法在数据挖掘中的应用领域。最后展望了未来的相关研究方向,蚁群算法在生物数据库等其它方向的研究前景,为数据挖掘任务的解决提供了一个新的平台。