赞
踩
机器学习的基础特点是从数据中自动分析获得规律,并且利用获取的规律进行预测的算法。也就是说是一个分析数据,总结规律且通过规律去预测别的结果的过程。
个人总结:
特征值就是一些事务的特征。目标值就是最终的结果。特征值会影响目标值,而目标值是特征值的最终归属。
监督学习:有特征值有目标值
非监督学习:有特征值无目标值
训练集(training set/data)/训练样例(training examples): 用来进行训练,也就是产生模型或者算法的数据集
测试集(testing set/data)/测试样例 (testing examples):用来专门进行测试已经学习好的模型或者算法的数据集
一般情况下,训练集与测试集的比例一般是7:3,6:4,8:2
1、把数据拆分为训练集和测试集
2、用训练集和训练集的特征向量来训练模型
3、用学习来的算法运用在测试集上评估算法
(1)分类
决策树 银行信用自动评估系统
临近取样 人脸识别
支持向量机 图片中的红眼检测 结肠癌早晚期分类
神经网络算法 手写数字识别 图片分类
(2)回归
线性回归 销售预测 价格预测
零线性回归
按照机器学习的数据分类
标称型:标称型目标变量的结果只在有限目标值中取值,比如说:去、不去(用于分类)
**数值型:**数值型的目标变量的结果在无限的数值集合中取值,比如说:100.1 ,10000.001(用于回归分析)
按照数据本身的分布特性
**离散型:**没有规律,数值只能用自然数或者整数单位计算的,比如公司人数、进球个数或者某个类别
**连续型:**存在规律,在指定的区间内,可以是任何一个数值,比如电影的票房,叶片的大小
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。