赞
踩
"An outlier is an observation which deviates so much from other observations as to arouse suspicions that it was generated by a different mechanism." — D. M. Hawkins,Identification of Outliers, Chapman and Hall, 1980.
异常检测(anormaly detection),或者又被称为"离群点检测"(outlier detection),是机器学习研究领域中跟现实紧密联系、有广泛应用需求的一类问题。但是,什么是异常,并没有标准答案,通常因具体应用场景而异。如果要给一个比较通用的定义,很多文献通常会引用Hawkins在文章开头那段话。很多后来者的说法,跟这个定义大同小异。这些定义虽然笼统,但其实暗含了认定"异常"两个标准或者说假设:
1.异常数据跟样本中大多数数据不太一样
2.异常数据在整体数据样本中占比比较小
为了刻画异常数据的"不一样",最直接的做法是利用各种统计的、距离的、密度的量化指标去描述数据样本跟其他样本的梳理程度。
机器学习-异常检测算法(1):https://zhuanlan.zhihu.com/p/27777266
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。