赞
踩
流数据出现的场景:网络监控、传感器网络、航空航天、气象监控、金融服务等应用领域。
最大最小值规范化 ( 需要依靠属性A的最值 )
将属性A的值 v 基于A的最大最小值规范化为 v’。
Z-score规范化 ( 借助于属性A 的分布 )
将属性A的值 v 基于A的均值和标准差规范化为 v’。
小数定标规范化
夹角余弦:两个向量夹角的余弦可以表示为两个向量的 方向差异 。
杰卡德Jaccard 相似系数:用于衡量两个集合 相似度 的一种指标。
相关性系数:用于衡量数据的 相关性 的指标 。
距离函数
高维空间中两点 x 和 y 的 欧式距离 ( Euclodean distance )
闵氏距离 ( Minkowski distance ) : 更广泛应用
二者对比:预测任务是在数据上 进行归纳以做出预测 ; 描述性挖掘主要是 刻画目标数据的一般性质 。
KNN 缺点:
改进的 KNN 算法:
7.1 深度学习的具体模型及方法
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。