在线报名
报名咨询
全站搜索未启用
跳到主要内容

C4.5算法为ID3的延伸,它可以处理缺失值、连续变量及剪枝等;信息增益最大的划分原则容易产生小而纯的子集,例如企业代码、日期等等,无法作出可靠预测。C4.5提出了增益比(gain ratio)的概念,其定义如下所示:

其中k是划分的总数。这代表如果某个属性产生了大量的划分,它的划分信息将会很大,从而降低增益比。

最后修改: 2020年06月2日 Tuesday 13:48