当前位置:   article > 正文

关联规则、支持度(support)、置信度(confidence)

支持度

关联规则

关联规则:用于表示数据内隐含的关联性

  • Support(支持度):表示同时包含A和B的事务占所有事务的比例。如果用P(A)表示使用A事务的比例,那么Support=P(A&B)
  • Confidence(可信度):表示使用包含A的事务中同时包含B事务的比例,即同时包含A和B的事务占包含A事务的比例。公式表达:Confidence=P(A&B)/P(A)
  • Lift(提升度):表示“包含A的事务中同时包含B事务的比例”与“包含B事务的比例”的比值。公式表达:Lift=( P(A&B)/P(A))/P(B)=P(A&B)/P(A)/P(B)。
    提升度反映了关联规则中的A与B的相关性,提升度>1且越高表明正相关性越高,提升度<1且越低表明负相关性越高,提升度=1表明没有相关性。

参考链接:https://www.jianshu.com/p/dc053deb94f2

关联分析

定义
在这里插入图片描述
关联分析研究的关系
在这里插入图片描述
基本概念
在这里插入图片描述

支持度(support)

支持度:{X, Y}同时出现的概率
在这里插入图片描述
支持度没有先后顺序之分

置信度(confidence)

置信度:购买X的人,同时购买Y的概率
在这里插入图片描述

其他内容:

1、数据分析之T检验

2、数据分析之参数检验与非参数检验

3、数据分析之正态性检验

4、Jupyter 中的表格样式 高亮设置

更多内容请移步:https://blog.csdn.net/dd18203614685

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号