赞
踩
来自周志华《机器学习》一书,包含自己的理解。
有任何的书写错误、排版错误、概念错误等,希望大家包含指正。
我们要去买西瓜,如何判断西瓜的好坏?
首先我们观察其色泽,如果是青绿色,再看它的纹理,如果纹理清晰,我们还会敲一敲瓜,如果声音清脆,那么我们就断定它是个好瓜。
按照这个逻辑,可以简单地构建一棵决策树:
我们是如何得到这棵决策树的?
瓜农们种瓜无数,阅瓜无数,凭借着他们遇到各种各样的好瓜与坏瓜的经验,总结出来一套我们用于生成决策树规律。
机器也是类似的,我们将大量的西瓜数据和学习方法提供给机器,让机器从西瓜数据中学习判断瓜好坏的方法,它在学习过程中会生成一棵完整决策树,最终我们可以利用“学有所成”的机器判断其他瓜的好坏。
一般的,一棵决策树包含一个根结点、若干个内部结点和若干个叶结点;叶结点对应于决策结果,其他每个结点则对应于一个属性测试;每个结点包含的样本集合根据属性测试的结果被划分到子结点中;根结点包含样本全集。从根结点到每个叶结点的路径对应了一个判定测试序列。决策树学习的目的是为了产生一棵泛化能力强,即处理未见示例能力强的决策树,其基本流程遵循简单且直观的“分而治之”(divide-and-conquer)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。