赞
踩
异常检测算法用来检测数据集中的一些异常样本。
异常检测算法属于非监督模型,即没有明确的标签值。
使用高斯分布来对数据集中的每个特征进行概率建模,每个特征xi各自生成一个高斯函数。
对于特征xi,若输入x,高斯函数计算输出的是该取值x在特征xi所有训练集值中出现的概率,通过概率来检测该取值是否异常,从而判断该样本是否异常。
尽管异常检测算法是非监督模型,但是我们可以通过引入标签值来进行算法的评估:
对于部分已经确定异常的样本,我们将其标签设为“异常1”。然后将这部分样本划分为测试集和交叉验证集,分别在算法训练时、训练后进行算法预测性能的评估,交叉验证算法还可以调整ε等参数的值。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。