赞
踩
要期末了,欠了一大堆课程作业要完成,赶着DDL学一下ID3算法。
作业的要求是:实现ID3算法,并完成实验观察。提交有注解的代码和实验报告,实验报告中需要显示出所获得的决策树。
采用UCI机器学习数据库中的数据集:DNA 数据集 (STATLOG 版本) - 灵长类动物剪接位点基因序列 (DNA)
在给定DNA序列的情况下(A,C,T,G -> 001,010,100,000),识别供体E(exon)和受体I(intron)连接部分。标签在最后一列:EI=1,IE=2,N=3。
ID3算法(Iterative Dichotomiser 3)是一种用于生成决策树的算法,ID3算法基于信息论中的熵和信息增益来选择决策树的分裂属性。主要用于分类任务。
对于给定的数据集 D ,熵定义为:
其中,声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:【wpsshop博客】
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。