赞
踩
业务需求分析是机器学习算法工程的第一步,是整个项目的基础,也是整个流程当中最重要的环节,主要体现在以下几个方面:
获取数据:获取业务相关数据,用于机器学习项目建模,训练,调参,优化等。
数据预处理主要是针对数据本身,业务需求,以及算法需求对原始数据进行的一系
列操作。比如:
特征工程是指从原始数据转换为特征向量的过程。特征工程是机器学习中最重要的 起始步骤,会直接影响机器学习的效果,并通常需要大量的时间。典型的特征工程 包括数据清理、特征提取、特征选择等过程。
在此阶段,主要是选择和应用各种建模技术,同时对它们的参数进行校准以达到最 优值。通常对于同一个数据挖掘问题,会有多种数据建模技术。一些技术对数据格 式有特殊的要求。因此,常常需要返回到数据准备阶段。实际操作如下:
模型评估是机器学习工程当中比较核心的环节之一,在模型训练完成之后,模型的 质量如何,是否还需要继续迭代,是否已经满足业务需要,都依靠模型评估结果。 因此需要选择一个能反映预测能力的评估指标(evaluation metric)。
常用评估标准
具体地包括:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。