首页|多元信息粒化与属性选择方法研究

多元信息粒化与属性选择方法研究

刘克宇

多元信息粒化与属性选择方法研究

刘克宇1
扫码查看

作者信息

  • 1. 江苏科技大学
  • 折叠

摘要

随着数据收集、传输及存储技术的迅猛发展,我们对某一对象的描述更为丰富,刻画更为全面,记录更为长久,因而产生的数据往往表现出一种高维的典型特征。作为一种处理高维数据有效的数据挖掘与知识发现技术,属性约简得到了广泛的推广与应用。然而,大数据时代发展至今,数据越趋呈现多样化的复杂特性,其不仅仅局限于数据的高维度,更体现在弱监督、多尺度等问题上。正因如此,如何针对诸如此类的数据复杂性进行高效精准的分析与挖掘成为了传统属性选择方法的发展瓶颈所在。 针对实际应用问题中数据的高维度、弱标签、多尺度等复杂特性,本文借鉴人类思考与解决复杂问题的粒化及分层认知模式,以多元视角进行目标解析,并在监督式信息粒化与融合、半监督粗糙数据分析、多粒度属性选择等方面展开了系统而又深入的研究与探讨,主要包括:发展了面向复杂数据的多元信息粒化与融合,多元集成的不确定性数据挖掘分析技术,构建了一整套多粒度视角下的属性选择算法框架,最终达到了能够有效提升复杂数据驱动下学习器的性能以及其问题求解的时间效率等目的。具体而言,本文的研究内容与创新成果主要涵盖以下几点。 一、提出了双半径下多重监督邻域信息粒化策略。 从粒计算的研究现状来看,实现信息粒化的方法大多属于无监督学习范畴,忽视了已有强监督信息的重要作用,因而缺乏在监督学习任务中的泛化性能。鉴于此,通过引入成对约束,参考样本的标签信息,在类与类之间进行样本的分割,并进一步地设计了类内类外双半径机制,分别对分割样本的相似度进行区别性地调控,指导性地给出了多重邻域信息粒化的监督式策略,过滤了信息粒化过程中易残留的不精确或不一致信息,有效地提升了信息粒化在属性噪声环境下的抗干扰能力。 二、提出了半监督式多元集成的粗糙不确定性分析方法。 从粗糙不确定性分析的研究现状来看,很多方法都着眼于标签完备的决策系统,过度依赖属性与标签的交互结果,而在处理标签缺失数据时就显得尤为棘手。此外,现有的分析手段往往过于单一,不足以充分挖掘隐含的深层知识与规律。鉴于此,详细剖析了当前粗糙不确定性分析方法在半监督问题上的症结所在,并进一步地提出了半监督环境下集成粗糙不确定性分析的新策略,在局部多元视角下观测属性空间,既赋予了半监督属性选择合理的语义解释,又拓宽了粗糙集方法在该问题上的应用前景。 三、提出了多粒度视角下属性选择框架。 从属性约简的研究现状来看,很多工作都仅考虑单个粒度层面上的约简求解,其面向由数据扰动造成的粒度变换问题时收效甚微。鉴于此,首先揭示了属性约简在粒度意义下的构造流程,并明晰了信息粒化与属性约简之间的内在关联机理。在此基础上,从信息融合的角度提出了多粒度属性约简的概念,并设计了一大类求解多粒度约简的高效算法框架,从而有效地解决了属性约简在多粒度视角下的局限性,并显著提升了约简求解的时间效率。

关键词

属性约简/粒计算/信息粒化/多粒度/粗糙集

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

杨习贝

学位年度

2020

学位授予单位

江苏科技大学

语种

中文

中图分类号

TP
段落导航相关论文