当前位置:   article > 正文

杰卡德( Jaccard)相似度_杰卡德相似度原理

杰卡德相似度原理

Jaccard相似系数(Jaccard similarity coefficient)用于比较有限样本集之间的相似性与差异性。Jaccard系数值越大,样本相似度越高。

两个集合A和B交集元素的个数在A、B并集中所占的比例,称为这两个集合的杰卡德系数,用符号 J(A,B) 表示。
在这里插入图片描述
当集合A,B都为空时,J(A,B)定义为1。

是用来衡量两个样本相似度的指标。
Jaccard系数只关心个体间共同具有的特征是否一致这个问题。
可用于用于数据聚类,特别适合于应用到稀疏度过高的数据。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/241491
推荐阅读
相关标签
  

闽ICP备14008679号