当前位置:   article > 正文

协议特征自动化提取技术之Apriori算法_多协议自动化提取模型怎么做

多协议自动化提取模型怎么做

背景:

Apriori算法是用于在关系数据库上频繁进行项目集挖掘和关联规则学习的算法,利用逐层搜索遍历的迭代方法找出数据中项集的关系,形成规则,过程是由联接(类矩阵运算)和修剪(去掉无必须的中间结果)组成。项集中包含K项集,项集出现频率是包含项集的事务数,称为项集频率。如果某项集满足最小支持度,为频繁项集。由Apriori确定的频繁项目集可用于确定突出显示数据库总体趋势的关联规则:诸如市场菜篮子分析等领域。

核心思想:

通过候选集生成向下封闭检测来挖掘频繁项集;

优点:

逐层搜索迭代的方法,算法简单明了,无复杂推导,易于实现;

缺点:

对数据库扫描次数多;产生大量中间项集;采用唯一支持度;适应面窄;

数据挖掘Apriori算法遵循步骤:

1.联接步骤:通过将每个项目与其自身联接,从K个项目集生成(K+1)个项目集
2.修剪步骤:扫描数据库每个项目的计数,如果候选项目未达到最低支持要求,则认为该项目不常见,因此将其删除,执行此步骤减小候选项目集大小。
  • 1
  • 2

概述:

每个事务都视为一个itemset,给定一个阈值C,Apriori算法会识别至少器子集的项目集C数据库中的事务,采用“自上而下”的方法,

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/311614?site
推荐阅读
相关标签
  

闽ICP备14008679号