赞
踩
本文面向AI小白。
题外话
作者认为学习是否有成果可以表现在三个方面:一是可以当众讲出来。二是可以写出来;三是可以做出来。当然不是每个人都有当众讲的机会,所以要用自己的话写出来。如何用自己的语言简洁正确的表达是一个不断练习的过程。希望可以坚持。
当前不存在广泛被认可的定义来描述机器学习。第一个机器学习的定义来自于 Arthur Samuel。他定义机器学习为,在进行特定编程的情况下,给予计算机学习能力的领域。
目前存在几种不同类型的学习算法。主要的两种类型被我们称之为监督学习和无监督学习。简单来说,监督学习这个想法是指,我们将教计算机如何去完成任务(在一个判断照片中的人美不美的问题上,再输入照片的时候,我们要告诉计算机什么是美。什么是丑;什么是对,什么是错……)而在无监督学习中,我们打算让它自己进行学习(例如:输入大量动物图片数据,计算机会根据不同类型动物的各种特点,自动将其分为很多类,至于计算机判断了哪些特点,我们无从而知)。下面详细讲解这两种方法。
我们还是举一个例子来说明。举一个有趣的例子吧,比如说,我们要实现一个系统,来判断电影中是否出现接吻的镜头。那么我们要完成的系统要达到的目标就是——输入视频,给出具体哪些时间段出现了接吻画面。
那么我们使用监督学习的方式来训练系统的模型,首先我们需要大量接吻、类似接吻……的图片集。并且将接吻标记为1,不接吻标记为0,将标记好的大量图片输入我们事先设计好的程序中。(这个过程呢,是训练的过程,训练完成之后,我们会得到一个模型,这个模型即是计算机对于接吻这件事的学习结果),之后,我们使用这个模型,使用大量测试的电影视频,每一个接吻的画面都会有一个概率输出。根据概率大小可以判断时间是否发生。
监督学习中,每条训练数据都被标记了是或者否的标签,所以,对于监督学习里的每条数据,
我们已经清楚地知道,训练集对应的正确答案。
在无监督学习中,我们已知的数据。看上去有点不一样,不同于监督学习的数据的样子,即无监督学习中没有任何的标签或者是有相同的标签或者就是没标签。所以我们已知数据集,却不知如何处理,也未告知每个数据点是什么。别的都不知道,就是一个数据集。你能从数据中找到某种结构吗?针对数据集,无监督学习就能判断出数据有两个不同的聚集簇。这是一个,那是另一个,二者不同。是的,无监督学习算法可能会把这些数据分成两个不同的簇。所以叫做聚类算法。聚类算法的例子,比如新闻分类,系统自动的在一大堆新闻中间将内容相似的消息聚类成为一个类型,然后展示出来。
这里仅仅概要介绍了机器学习最常用到的两种类型的算法类型。还有半监督学习,在数据集中,标记一部分,一部分不标记。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。