计算机技术与发展2020,Vol.30Issue(5) :185-189.

基于C4.5决策树分类算法的改进与应用

Improvement and Application of C4 . 5 Decision Tree Classification Algorithm

李春生 焦海涛 刘澎 刘小刚
计算机技术与发展2020,Vol.30Issue(5) :185-189.

基于C4.5决策树分类算法的改进与应用

Improvement and Application of C4 . 5 Decision Tree Classification Algorithm

李春生 1焦海涛 1刘澎 1刘小刚1
扫码查看

作者信息

  • 1. 东北石油大学 计算机与信息技术学院,黑龙江 大庆 163318
  • 折叠

摘要

决策树算法是在已知具有不同特征的样本数据出现的概率基础上,构建决策树来进行数据分析的一种算法.在数据分类算法中,决策树算法是一种经典的分类决策算法.首先,将所有的数据特征看作是各个树的节点,遍历所有特征,其中每当遍历到其中某个特征时,对特征进行分割处理,并记录分割点的数据信息,作为划分子节点的纯度依据.其次,比较记录的数据特征以及判定最优特征,寻找最优划分方式,对样本数据集进行分割操作.最后,构建符合规则的决策树.针对传统的决策树C4.5算法计算信息增益率时间过长的问题,提出了一种改进的K-C4.5算法,引用麦克劳林公式和泰勒公式的思想,将信息增益率计算公式从对数函数转化为非对数函数,从而降低运算的时间效率.以实际数据集进行测试,验证了改进后的算法具有一定的效果.

关键词

决策树/数据概率/信息增益率/时间效率/改进算法

引用本文复制引用

基金项目

国家自然科学基金面上项目(51774090)

黑龙江省自然科学基金面上项目(F2015020)

出版年

2020
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
被引量13
参考文献量14
段落导航相关论文