首页|基于混合近邻局部分布差异的离群点检测算法

基于混合近邻局部分布差异的离群点检测算法

扫码查看
离群点检测作为数据挖掘领域的重要任务,其目的是从表示事件或对象行为的数据中找出不一致数据。目前大部分传统的无监督离群点检测算法,如基于距离或密度的方法,识别多维度空间离群数据时都存在因维度诅咒导致检测精度衰退的问题。论文提出了基于混合近邻的离群点检测算法,该算法以数据项的混合近邻作为新的局部影响空间,以双向共享近邻和欧式距离重新定义了数据项的相似度计算方式,通过对比数据项与其局部影响空间中样本的平均局部分布差异衡量数据的局部离群程度,从而识别离群点。在合成和真实数据集上和其他同类算法的对比实验结果证明,该算法在离群点检测方面具有一定的提高。
Outlier Detection Based on Local Distribution Difference of Hybrid Nearest Neighbors
Outlier detection is an important task in the field of data mining.Its purpose is to find inconsistent data from the da-ta representing events or object behaviors.At present,most traditional unsupervised outlier detection algorithms,such as methods based on distance or density,have the problem of declining detection accuracy due to the curse of dimensionality when identifying outlier data in multi-dimensional space.This paper proposes an outlier detection algorithm based on hybrid nearest neighbors.The algorithm uses the hybrid nearest neighbors of data items as a new local influence space,and redefines the similarity calculation method of data items by bidirectional sharing nearest neighbors and Euclidean distance.The average local distribution difference of the sample in its local influence space measures the local outlier degree of the data,so as to identify outliers.The experimental re-sults of comparison with other similar algorithms on synthetic and real data sets prove that this algorithm has a certain improvement in outlier detection.

unsupervisedoutlier detectionhybrid nearest neighborslocal distribution difference

张君、范铭、金举

展开 >

西安交通大学软件学院 西安 710049

西安交通大学网络空间安全学院 西安 710049

无监督 离群点检测 混合近邻 局部分布差异

国家自然科学基金项目中国博士后项目中国博士后项目

619023062019TQ02512020M673439

2024

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2024.52(2)
  • 20