赞
踩
什么是机器学习:
机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。
机器学习工作流程:
获取到的数据集介绍:
1、专有名词
样本
特征
目标值
特征值
2、数据类型构成
类型一:特征值+目标值
目标值分为离散还是连续
类型二:只有特征值,没有目标值
3、数据划分:
训练数据(训练集) — 构建模型
0.7–0.8
测试数据(测试集) — 模型评估
0.2–0.3
4、数据基本处理
即对数据进行缺失值、去除异常值等处理
5、特征工程
定义:
把数据转换称为机器共容易识别的数据
为什么需要特征工程:
数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。
包含内容:
特征提取
特征预处理
特征降维
6、机器学习
选择合适的算法对模型进行训练
7、模型评估
对训练好的模型进行评估
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。