当前位置:   article > 正文

支持度和置信度

支持度和置信度

支持度和置信度是数据挖掘和关联规则挖掘领域中常用的两个指标,用于衡量项集之间的关联程度。

支持度(Support):支持度是指某个项集在数据集中出现的频率,即该项集在数据集中出现的次数与总事务数之比。支持度用来衡量一个给定项集的出现频率,是最基本的度量标准。其计算公式为:
在这里插入图片描述
其中,X是项集,Transactions containing X是包含项集X的事务数量,Total transactions是总事务数。

置信度(Confidence):置信度是指在某个条件下,出现关联规则的概率。具体来说,如果一个项集X出现,那么项集Y也出现的概率就是置信度。其计算公式为:
在这里插入图片描述
其中,X和Y是项集,Support(X ∪ Y)是同时包含X和Y的事务数,Support(X)是包含项集X的事务数。

支持度和置信度通常用于关联规则挖掘,以发现数据集中不同项集之间的关联关系。例如,在购物篮分析中,可以使用这些指标来找出顾客购买商品之间的关联规则,从而做出更好的市场营销策略。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Guff_9hys/article/detail/855586
推荐阅读
相关标签
  

闽ICP备14008679号