赞
踩
支持度和置信度是数据挖掘和关联规则挖掘领域中常用的两个指标,用于衡量项集之间的关联程度。
支持度(Support):支持度是指某个项集在数据集中出现的频率,即该项集在数据集中出现的次数与总事务数之比。支持度用来衡量一个给定项集的出现频率,是最基本的度量标准。其计算公式为:
其中,X是项集,Transactions containing X是包含项集X的事务数量,Total transactions是总事务数。
置信度(Confidence):置信度是指在某个条件下,出现关联规则的概率。具体来说,如果一个项集X出现,那么项集Y也出现的概率就是置信度。其计算公式为:
其中,X和Y是项集,Support(X ∪ Y)是同时包含X和Y的事务数,Support(X)是包含项集X的事务数。
支持度和置信度通常用于关联规则挖掘,以发现数据集中不同项集之间的关联关系。例如,在购物篮分析中,可以使用这些指标来找出顾客购买商品之间的关联规则,从而做出更好的市场营销策略。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。