赞
踩
数据挖掘课后作业需要用到这个软件,老师将基本参数设置好了,但是具体各项是什么意思呢?
下面是老师预设的参数,
Run Apriori on “transaction” data set. Set the “Type” of “COD” as “Typeless”, set the “direction” of all the other 20 categories as “Both”, set their “Type” as “Flag”. Set “Minimum antecedent support” to be 7%, “Minimum confidence” to be 45%, and “Maximum number of antecedents” to be 4 in the modeling node (Apriori node). In general you should explore by trying different values of these parameters to see what type of rules you get.
下面进行挨个解释,
这个直译过来是 ** 最小先行支持度** ,即在Apriori算法启动最初时,用于选择频繁项集的那个最小支持度,即普通项集与频繁项集之间的那个阈值。但在clementine软件中的名字为minimum rule support。
这个是最小置信度,即Apriori在最后利用频繁项集生成关联规则时,需要判断关联规则的置信度是否大于最小置信度,大于才能被选出为强关联规则。
这个是最大前置项的个数。比如我们一个关联规则为: A , B , C = > D A,B,C=>D A,B,C=>D,前面的A,B,C就是这条规则的前置项。Maximum number of antecedents就是对这个的个数做了限制。设置小一些的Maximum number of antecedents可以加快算法速度。
参考资料:IBM官网
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。