赞
踩
从广义上讲, 机器学习是一种能够赋予机器学习的能力,让它以此完成直接编程无法完成的功能的方法
从实践的意义上讲, 机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法
人类的学习是一个人根据过往的经验,对一类问题形成某种认识或总结出一定的规律,然后利用这些知识来对新的问题下判断的过程
同样机器学习也是类似的过程
那么机器学习如何积累经验,总结规律呢?--------->都是通过数学的方法和原理
机器学习是指用某些算法指导计算机利用已知数据得出适当的模型,并利用此模型对新的情境给出判断的过程
数据之于机器学习
而在这整个过程中,最关键的是数据,是数据,是数据!重要的事情说三遍。
如果说模型是我们希望造出来的火箭,那数据就是它的燃料。
数据量直接决定了我们的火箭只是个概念玩具,还是能够载人登月,还是可以飞出太阳系探寻智慧生物
正所谓“No data,no intelligence”。
打个比方的话,数据和算法之于计算机好比阅历和智商之于人类。丰富的阅历所带来的智慧,自然不是靠一点小聪明就能驾驭得了的
AlphaGo经过和自己左右互搏数千万局才达到现今的棋力,而和他不相上下的李世石,穷其一生打谱恐怕也到不了这个数目的百分之一
AlphaGo就是一个智商10棋龄10000年的老妖精,打败李世石主要靠的是经验
李世石就是一个智商140棋龄25年的小妖精,输给AlphaGo主要是‘经验’不足
机器学习根据所处理数据种类的不同,可以分为有监督学习,无监督学习,半监督学习和强化学习等几种类型
实践中应用较多的也就是前两种
所谓监督学习,就是说数据样本会告诉计算机在该情形下的正确输出结果,希望计算机能够在面对没有见过的输入样本时也给出靠谱的输出结果,从而达到预测未知的目的X ----> y(目标值)
就像一个学生通过做多套高考模拟卷并订正答案的方式来提高高考成绩
在这种情形下,数据就像是监督计算机进行学习的教师,故而得名
根据输出结果是离散值还是连续值,监督学习可以分为分类问题和回归问题两大类
监督学习在文字、语音、图像识别,垃圾邮件分类与拦截,网页检索,股票预测等方面有着广泛应用
无监督学习,是指数据样本中没有给出正确的输出结果信息。
这就像做了好多套没有答案的模拟卷,最后还要去高考
听上去是不是既惊悚又不靠谱
但其实做没有答案的试卷也是能学到很多有价值的信息的,比方说哪些题出现频率高,那些题爱扎堆考,等等
比如Google新闻,每天会搜集大量的新闻,然后把它们全部聚类,就会自动分成几十个不同的组(比如娱乐,科技,政治…),每个组内新闻都具有相似的内容结构
事先没有任何训练数据样本,而直接对数据进行建模(转例:比如我们去参观一个画展,我们对艺术一无所知,但是欣赏完很多幅作品之后,我们面对一幅新的作品之后,至少可以知道这幅作品是什么派别的吧,比如更抽象一些还是更写实一点,虽然不能很清楚的了解这幅画的含义,但是至少我们可以把它分为哪一类)
KNeighborClassifier
LinearRegression
Logistic
SVM
DecisionTree
XGboost
贝叶斯
KMeans
TensorFlow
你知道的越多,你不知道的越多。
有道无术,术尚可求,有术无道,止于术。
如有其它问题,欢迎大家留言,我们一起讨论,一起学习,一起进步
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。