赞
踩
目录
什么是机器学习?当前并没有一个统一的定义,常见的观点有:
这里重点把握几个关键词:经验(以往的数据)、算法(模型)、性能。
机器学习是数据通过算法构建出模型并对模型性能进行评估,如果达到要求就拿这个模型来测试其他的数据,如果达不到要求就调整算法重新建立模型,再次进行评估,如此循环迭代,直到最终获得满意的经验来处理其他的数据。
此外,大家简单理解下人工智能、机器学习和深度学习这三者的关系。人工智能的范畴最广,机器学习只是里面的一部分,深度学习又是机器学习中的一部分。
机器学习已广泛应用于数据挖掘、计算机视觉、自然语言处理、统计学习、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音识别、模式识别 、战略游戏 和 机器人等领域。
由于篇幅限制,本系列不会详细介绍算法实现的细节以及算法的数学推导过程,如果大家对这一部分比较感兴趣,这里给大家推荐两本参考书。
(1)数据收集和预处理:(原始的数据往往不能满足要求,需要做一些处理,例如归一化、缺失值处理等)
(2)特征抽取:(抽取哪些关键特征,如何表示这些特征)
(3)模型选择和训练:(如何选择模型,如何学习模型中的参数)
(4)评估和预测(采用什么标准来评估模型,不同的标准模型效果会有较大区别。例如误差率、查全率、召回率等等)
Python中机器学习相关的第三方库很多,这里我们重点介绍使用较为广泛的Scikit-learn。
Scikit-learn 涵盖了几乎所有主流机器学习算法,并且提供了一致的调用接口,基于 Numpy 和 SciPy 等Python数值计算库,提供了高效的算法实现。
Python标准库默认不包含 scikit-learn,需要自己下载安装:
Scikit-learn基本功能主要分为六部分:分类、回归、聚类、数据降维、模型选择和数据预处理。Scikit-learn官网:https://scikit-learn.org/stable/。
Scikit-learn 中主要子库及其内容。
更多关于手把手教你学Python的文章请关注微信公众号:手把手教你学编程。详细的视频讲解可查看 CSDN学院 里的手把手教你学Python系列视频:https://edu.csdn.net/lecturer/5686。 欢迎加入QQ群一起学习交流:858228002 。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。