赞
踩
作者:禅与计算机程序设计艺术
在机器学习领域,决策树(decision tree)是一种常用的模式分类算法。它能够将输入数据划分成不同类别或不同输出值,并据此做出预测。而对于复杂的数据分析任务来说,用决策树这种经典算法进行分析就显得十分合适了。本文将通过对决策树算法的基本原理和具体实现过程,带领读者一步步了解其工作原理。
本文假定读者具备相关机器学习基础知识,比如机器学习的相关理论、算法、模型等。文章所涉及到的算法一般采用CART(Classification And Regression Tree,即分类回归树),并且所涉及的代码示例主要基于python语言。
决策树算法起源于1974年西班牙的卡罗尔·卡西多(Carlos Carrasco)提出的一种监督机器学习方法。当时他在西班牙诺瓦那大学取得博士学位后,利用该博士论文中的数据集对决策树进行了研究。他对决策树算法的命名由来自于“Decision”之意,在西班牙语里代表行动或决策。
概括地说,决策树算法就是从数据集中找到一条最优的划分路径,使得各个类别的数据点尽可能集中在同一区域。在机器学习领域,决策树算法具有以下几个优点:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。