在线报名
报名咨询
全站搜索未启用
跳到主要内容

ID3算法只能处理定性变量,且一个变量使用过之后就不能再次使用了。其伪代码如下所示:

function ID3 (R:尚未用过的变量集,T:在该节点训练数据集)

IfT为空集,返回失败信息;

IfT包含所有同样的分类变量的值,返回一个具有该值的单独节点;

IfR为空,那么返回一个具有最大频率的当前变量的值;

Let 具有最大Gain(D,T)的变量;

Let {dj |j=1,2,⋯,m} 为D的值;Let{Sj |j=1,2,⋯,m} 相应于D的值的T的子集;

Return 以D为标签的节点及标为d1,d2,⋯,dm的树枝;这时ID3的函数和参数为ID3(R-{D},S1), ID3(R-{D},S2),..., ID3(R-{D},Sm) ;

end ID3;

最后修改: 2020年06月2日 Tuesday 13:48