当前位置:   article > 正文

数据挖掘可以挖掘什么类型的模式?

数据挖掘可以挖掘什么类型的模式?

一、挖掘频繁模式、关联和相关性

频繁模式(frequent pettern)是在数据中频繁出现的模式。

频繁项集一般是指频繁的在事务数据集中一起出现的商品的集合。

频繁出现的子序列,如顾客倾向于先买相机,再买内存卡这样的模式就是一个(频繁)序列模式。

子结构可能涉及不同的机构模式,如图、数或格。如果一个子结构频繁出现,则可称为(频繁)结构模式。

挖掘频繁模式可以发现数据中有趣的关联和相关性。

关联规则可分为单维关联规则和多维关联规则。

二、用于预测分析的分类与回归

分类是找出描述和区分数据类或概念的模型,以便能够使用模型预测类标号未知的对象的类标号。

分类和回归是有监督的学习方法。数据集分为训练集和测试集。

分类是预测类别的标号。

回归是建立连续值函数模型,即用来预测难以获得的数据值或缺失的数据。

两种方法可以成为数值预测和类标号预测。

三、聚类分析

聚类分析是一种无监督的学习方法。

聚类的特点是最大化类簇间的距离、最小化类簇内样本的距离。

四、离群点分析

大部分数据挖掘方法都将离群点视为噪声或异常而丢弃。

但在欺诈检测等应用中,离群点的出现则很重要。


参考文献:数据挖掘:概念与技术(原书第三版)

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/天景科技苑/article/detail/923746
推荐阅读
相关标签
  

闽ICP备14008679号