首页|基于邻域粗糙集的约简算法及分类器的研究

基于邻域粗糙集的约简算法及分类器的研究

高阳

基于邻域粗糙集的约简算法及分类器的研究

高阳1
扫码查看

作者信息

  • 1. 青岛大学
  • 折叠

摘要

粗糙集理论是一种处理不确定、不一致等不完备信息的新型数据分析工具,被广泛应用于数据挖掘、决策分析和故障诊断等领域. 在粗糙集理论中,经典的Pawlak粗糙集模型只适合处理离散型变量,不能直接处理连续型变量.为了解决此问题,通过引入邻域粒化和粗糙逼近的概念引入邻域粗糙集模型,可以同时支持连续型和离散型两种数据类型,拓宽了粗糙集理论的应用范围. 属性约简是粗糙集理论的核心内容之一.属性约简是指在保持原有决策系统分类和决策能力不变的情况下,删除冗余属性.本文主要研究内容就是对现有的属性约简算法进行改进,并通过实验进行验证.除此之外,将改进的算法与决策树分类算法相结合,实现更有效的分类.本文研究工作如下: 1、在基于邻域粗糙集的属性约简算法中,正域计算是保证其有效性的重要依据,也是影响其时间开销的最主要部分.为了减少算法开销,采取矩阵保留策略,利用矩阵记录样本间度量计算值的平方,将原本n维上的度量计算改进为1维上的计算.基于上述方法对F2HARNRS算法进行改进,提出基于矩阵保留策略的前向搜索属性约简算法.实验证明该算法在提高算法效率方面是有效的. 2、计算邻域样本时,δ是一个关键的参数,它的取值影响着约简结果.本文基于矩阵保留策略对FHARA算法进行改进,并采用标准差度量?的取值,即先将每一列的属性值取标准差,再将这些标准差取标准差作为阈值?的值,提出了基于矩阵保留策略的快速属性约简算法.实验结果表明,对于大规模数据集而言,该算法是有效的且更快速的. 3、分析当前的决策树分类算法研究现状,将改进的正域计算方法与决策树分类算法相结合,对经典的ID3算法进行改进,提出基于正域的决策树算法.通过多个数据集的实验验证,该算法能够提高构建决策树的效率.

关键词

分类器/正域/邻域粗糙集/属性约简/决策树

引用本文复制引用

授予学位

硕士

学科专业

计算机科学与技术

导师

刘遵仁

学位年度

2019

学位授予单位

青岛大学

语种

中文

中图分类号

TP
段落导航相关论文