赞
踩
机器学习被普遍认为任何一个IT民工必备的工具之一,和学习任何语言工具一样,简单的体验一下或许非常简单。但这并不代表你能真正驾驭它,如果想深入不是一年两年能搞得定事情,本文作者总结了对于刚入门机器学习者需要注意一些事项。
机器学习包括无监督、半监督、监督、强化学习等,但是对于很多初入门的MLer可能就是监督学习,即给定训练样本和标签,学习出某个模型进行新样本预测。
学习=表示+评估+优化
由于我们不可能获取到全部训练样本,即使能也可能存储不下全部样本,这样必须有效提供模型泛化能力。
一个好的模型不仅仅是在训练数据上表现出好的效果,而是对于不可见样本也能表现出好的效果。因此训练时常将训练数据划分为测试集合和训练集合,通过训练集合进行模型学习,测试集合进行模型效果验证。对于模型参数的选择可以通过交叉验证(CV)进行选择。
由于
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。