赞
踩
一名985计科专业在校本科生,刚开始接触机器学习这门课程。想通过CSDN博客的方式整理并记录自己的学习思路,也希望以小白的角度去帮助自己还有更多人理解看似深奥的学科领域。
经过两年专业课与基础课的学习,我们已经有能力去接触机器学习这门课程。机器学习要求首先是数学功底深厚,微积分、线性代数、概率论将会发挥重要的作用也会是学习上最大的门槛,另外需要掌握基本的编程技巧并且熟练使用python语言。
我对自己也没有十足的信心,但我认为不会对一切挑战做足充分的准备,都是应该在学习的过程中发现问题弥补,无论是数学功底还是编程技巧让我们边学习边提升。机器学习当然是块硬骨头,越硬的骨头就越不该留到以后啃。
特别感谢中南大学梁毅雄教授与台湾大学李宏毅教授提供的教学与资料支持。博文仅仅设计本人的浅薄理解,欢迎大家提出问题。
引用李宏毅教授通俗的理解,机器学习其实就是自动寻找函数式的过程。函数式设计一对映射,从给出的输入到想要的输出之间建立的映射。而机器学习其实就是不断寻找调整最合适映射的过程。比如说:语音识别将输入的音频通过函数式映射转化为文字;图像识别将输入的图片识别出这是一只小猫;前两年爆火的Alpha Go识别现有棋局给出下一步落棋操作…
很多时候事物之间的规律很难由人类主观推断,要是万事万物都能有明确的界限,那么就不需要机器学习了。人类直接告诉计算机什么特征的是猫而不是狗,就不需要设计函数式不断学习调整了。正因为规律无法直接获得才需要计算机通过大量的计算去模拟逼近我们想要的答案。
1.任务:机器学习需要有明确的任务指示,也就是想要通过机器学习达成的目标。比如识别图片中动物的物种、识别语音中表达的含义、找到游戏下一步最优的方案等等。
2.性能:机器学习是一种近似模拟逼近的过程,因此我们得出的预估结果与实际情况或者正确答案之间会有一定的差距,而这个差距就体现为我们机器学习算法的性能。常用损失函数(Loss Function)来表征当前模型函数的优劣,并且有助于进一步调整参数。
3.经验:经验是机器学习的关键因素。根据经验的有无、经验的种类还可以将机器学习分为监督学习(有师学习)、非监督学习(无师学习)、半监督学习等等。经验是函数式预测的矫正标准。
4.完善:机器学习的目标一定是个可优化可发展的内容。不能是公理或者被严格证明的定理,可以用机器学习的方法去研究处理,但不可完善的主题是没有意义的。
我们的内容将不关注定义与形式,而是以通俗易懂的话去阐释自己的理解。
监督学习又名有师学习,这个名字更加的直接形象。老师的职责就是告诉学习中的学生什么是对什么是错,然后学生按照老师的标准发挥自己的个性去调整。虽然现实中老师不一定都是正确的,但在机器学习中的“老师”一定视为百分百正确的不二准则。
监督学习中会提供大量的人为标注过的数据,我们成为Labelled Data。在监督学习中更为关键的并不是模型与参数而是标注数据,往往在实际应用中标注数据需要由相关领域专家给出并且花费极高的代价。因此后续几种机器学习的种类,比如非监督学习、半监督学习、强化学习都是在标注数据不同程度欠缺的前提下产生的。
监督学习看似简单,但却是机器学习领域中最关键的组成部分。监督学习的核心问题有两个:回归(Regression)与分类(Classification)。那么这两大问题该如何区分呢?
两大问题均用来预测,但预测的内容与结果截然不同。回归问题预测的结果是连续的,往往输出的结果是一个数值。分类问题预测的结果是离散的,往往输出的结果是对一个事物打上标签。
比如:预测明天的温度数字,这是一个回归问题。预测明天是阴是晴,这却是一个分类问题。根据预测结果的不同便可以区分。
除此之外,回归可细分为:线性回归、逻辑回归、多项式回归等几种类型。分类可分为二分类、多分类等几种类型。
-现在的大部分机器学习模型,学习了任务1后掌握了任务1,学习了任务2后忘掉任务1掌握了任务2,学习了任务3后只剩下了任务3。那能否有一种学习模型,其学习过的知识全部存储,这样不断对这个模型进行不同角度的学习训练,或许就可以成为“天网”一样的机器人。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。