当前位置:   article > 正文

机器学习笔记

机器学习笔记

##https://person.zju.edu.cn/huhaoji#735702

ARTHUR SAMUEL 对机器学习的定义: Machine Learning is Fields of study that gives computers the ability to learn without being explicitly programmed.
机器学习是这样的领域,它赋予计算机学习的能力,(这种学习能力)不是通过显著式编程获的。

显著式编程

以让计算机自动区别菊花与玫瑰:如果人为的告诉计算机,菊花是黄色的,玫瑰是红色的。计算机看到黄色,就会把它识别为菊花,看到红色就会识别为玫瑰。这就是显著式编程。

if color == 'red':
	flower=rose
if color == 'yellow':
	flower=chrysanthemum
  • 1
  • 2
  • 3
  • 4

Tom Mitchell

                  “计算机程序可以在给定某种类别的任务 T 和性能度量 P 下学习经验 E ,如果其在任务 T 中的性能恰好可以用 P 度量,则随着经验 E 而提高。”
  • 1

示例 1:机器学习和根据人的身高估算体重

假设你想创建一个能够根据人的身高估算体重的系统(也许你出自某些理由对这件事情感兴趣)。那么你可以使用机器学习去找出任何可能的错误和数据捕获中的错误,首先你需要收集一些数据,让我们来看看你的数据是什么样子的:
请添加图片描述
图中的每一个点对应一个数据,我们可以画出一条简单的斜线来预测基于身高的体重

例如这条斜线:
Weight (in kg) = Height (in cm) - 100
…这些斜线能帮助我们作出预测,尽管这些斜线表现得很棒,但是我们需要理解它是怎么表现的,我们希望去减少预测和实际之间的误差,这也是衡量其性能的方法。
深远一点地说,我们收集更多的数据 (experience),模型就会变得更好。我们也可以通过添加更多变量(例如性别)和添加不同的预测斜线来完善我们的模型。

示例2:飓风预测系统

我们找一个复杂一点的例子。假如你要构建一个飓风预测系统。假设你手里有所有以前发生过的飓风的数据和这次飓风产生前三个月的天气信息。
如果要手动构建一个飓风预测系统,我们应该怎么做?
请添加图片描述

首先我们的任务是清洗所有的数据找到数据里面的模式进而查找产生飓风的条件。

我们既可以将模型条件数据(例如气温高于40度,湿度在80-100等)输入到我们的系统里面生成输出;也可以让我们的系统自己通过这些条件数据产生合适的输出。
我们可以把所有以前的数据输入到系统里面来预测未来是否会有飓风。基于我们系统条件的取值,评估系统的性能(系统正确预测飓风的次数)。我们可以将系统预测结果作为反馈继续多次迭代以上步骤。
让我们根据前边的解释来定义我们的预测系统:我们的任务是确定可能产生飓风的气象条件。性能P是在系统所有给定的条件下有多少次正确预测飓风。经验E是我们的系统的迭代次数。

机器学习的分类

根据是否有数据标注,机器学习可以分为监督学习无监督学习
监督学习:从已标注的训练数据中学习如何判断数据的特征,并将其用于对未标注数据判断的一种方法。
简而言之就是监督学习算法就是从训练数据集中学习到一个函数,当新的未标注数据到来时,该函数能独立完成对相应特征的判断,从而给出未标注数据的一个标签。这种形式的学习主要用于分类和回归任务。常见的线性回归和逻辑回归就属于典型的监督学习。
无监督学习不同于监督学习,它的学习算法是从未标注的训练数据中学习数据特征。因此,无监督学习使用的很多方法都是基于数据挖掘的,主要特点就是寻求、总结和解释数据。聚类分析就是典型的无监督学习。
实现机器学习的技术有很多,如神经网络、决策树、随机森林、支持向量机和深度学习等。虽然它们的设计思路不同,计算过程也不一样,但最终都是完成对特征的学习。但是对许多复杂的问题来说,特征提取并不是一件容易的事。如何精准高效的自动提取实体中的特征(图像)成为一种需求。
深度学习就是这样一个方法,它可以区分传统的机器学习方法,自动从数据中提取特征,并在图像、语音、文本等非结构化数据上的效果远好于传统的机器学习算法。

深度学习

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/147310
推荐阅读
相关标签
  

闽ICP备14008679号