首页|全局搜索密度峰值聚类中心的线性回归方法研究

全局搜索密度峰值聚类中心的线性回归方法研究

扫码查看
针对在数据量大且分布不均匀时非线性拟合效果不佳且易受离群点影响的问题,提出一种全局搜索密度峰值聚类中心的线性回归方法,采用密度峰值聚类方法根据样本分布密度将所有数据点划分为多个类簇,引入DKC值和AM度量降低离群点对聚类中心选取的影响,将聚类中心作为拟合的特征点进行分段线性拟合.通过对航班油耗的分段线性拟合的实验验证了该方法在此类拟合问题中的有效性,为线性回归分析提供了一种新思路.
Research on Linear Regression Method of Global Search Density Peak Cluster Center
Aiming at the problem of poor nonlinear fitting effect and susceptible to outliers when the amount of data is large and the distribution is uneven,a linear regression method of global search for the density peak clustering center is proposed,and the density peak clustering method is used according to the sample.The distribution density divides all data points into multiple clus-ters,introduces the DKC value and AM metric to reduce the influence of outliers on the selection of cluster centers,and uses the cluster centers as the fitted feature points for piecewise linear fitting.The experiment of piecewise linear fitting of flight fuel con-sumption verifies the effectiveness of this method in this type of fitting problem,and provides a new idea for linear regression analy-sis.

density peak clusteringoutliersDKC valueAM metriclinear regression

马翔

展开 >

中国民航大学电子信息与自动化学院 天津 300300

密度峰值聚类 离群点 DKC值 AM度量 线性回归

国家科技支撑计划民航局专项项目

2012BAC20B0304GH201661279

2024

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2024.52(5)
  • 11