赞
踩
三本经典机器学习算法书:机器学习:(周志华)西瓜封皮的书、(李)统计学习方法、深度学习数:花封皮的deeplearning 等
决策树:对数据if else then 的方式进行逐层划分。带标签的有监督的学习方式。
聚类:无监督的方式。无指示标签。根据样本点在样本空间上的分布进行分类。最终效果取决于选择的聚类特征
时间序列:ARIMA AR:体现规律性的循环。I:差分MA:平滑,平均。效果比现在的的RNN循环神经网络效果差很多。
朴素贝叶斯:基于概率的模型。有坚实的数学基础,有强可解释性。
SVM支持向量机:将两组数据分开来,而且能找到最优分界面。不是概率模型
关联规则:无监督方法。于传统统计方法不同的在于两个两个组合或者多个之间的组合之间平凡出现的关系
神经网络:现在的深度学习基本全是基于神经网络的。利用简单的单元结构按照网络的形式进行组织
HMM隐马尔可夫模型:在深度学习应用之前多应用于NLP。其进化版为条件随机场CRF,用于解决识别边界的划分问题。有时候会在神经网络的后端加入CRF。
回归算法:曲线拟合散点
遗传算法:不算是模型,而是一种求解最优化的方法。
K近邻、文本挖掘->NLP问题
机器学习工具:基本都是Python了。
三大经典算法介绍:决策树、关联规则、聚类
划分纯度的度量方式:基尼系数、熵等。熵entropy定义式:
熵减就是信息增益
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。