赞
踩
在机器、深度学习中,建模、评估都不难,都是套路。
机器学习最关键的是特征工程,怎么才能得到更有价值的输入。
(就比如我一直在考虑权重、特征的问题)
深度学习解决了很多人工的问题,显得更智能。通过网络自动学习特征。
API(Application Programming Interface)应用程序编程借口,即预先定义的函数,提供应用程序,无需访问源码,访问一组例程。如keras就是python编写的高级神经网络API,Tensorflow作为后端运行,支持快速实验,最小时延将想法转为成果。
其实学习机器学习、深度学习就是学会各个模型所应用的场景,适用的范围。
AI 人工智能(计算机视觉、自然语言处理、数据挖掘)
ML 机器学习
DL 深度学习
NN 神经网络 Neural Networks
RNN卷积(计算机视觉)
CNN循环、递归(自然语言处理)
数据获取
特征提取(适合问题,适合模型)(数据层面)(最关键)
建立模型
评估应用
1.数据特征决定模型上限
2.预处理和特征提取是最核心的
3.算法、参数选取只是决定如何逼近上限
机器学习:构建映射函数,通过算法使机器能从大量数据中学习规律,从而对新的样品进行决策。
特征提取:基于任务或先验去除无用特征。
深度学习:构建深度模型,自动学习好的特征表示。
表示学习:通过深度模型来学习高层语义特征。
过拟合:在训练集表现好,在测试集表现差,即泛化能力差。优化过度,经验风险最小化原则容易导致模型在训练集上错误率很低,但是在测试集上错误率很高。往往是由于训练数据少、以及噪声等原因造成。
解决方法:正则化,所有损害优化的方法都是正则化,要增加优化约束,干扰优化过程,使用验证集来测试超参数,如果错误率在验证集上不再下降,便提前停止。
人为设定的参数
机器学习问题可以转化为最优化问题,如梯度下降法,搜索步长α也叫作学习率learning rate(重要的超参数)
输入值:x(向量)
输入值的权重:w(向量)
净输入函数: z=w1x1+w2x2+…+wm*xm
偏置:(机器学习中把负的阈值或者权重w0=-θ),在直角坐标系中可以理解为直线的截距,目的是对神经元激活状态的控制。
变换函数、作用函数、激活函数f(x):有四种形式:阈值型、S型、伪线性型、概率型
感知器适用于简单模式分类,用于两类模式分类时,相当于用一个超平面(直线)将两类样本分开。感知器是研究其他网络的基础,易理解。简单单节点感知器具有分类原理,将分类知识存储于权向量,由权向量决定判决界面(直线、平面、超平面)以实验分类。
用途:感知器只能解决线性可分问题,输出只能是0和1
概念:感知器是用于离散时间型的神经网络,而自适应线性单元以连续线性模拟量为输出,结构与感知器网络相似。将期望输出与实际输出的误差作为调整信号,不断在线调整权向量,保证期望与实际输出相等。
用途:线性逼近一个函数式进行联想,用于信号滤波、预测、模型识别、控制。
优点:输出可以是任意值,采用W-H学习规则(最小均方差 LMS)进行训练,收敛速度更快,精度更高。
W-H学习规则:不需求导,简单,快。 (自相关矩阵相关概念)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。