赞
踩
Jaccard相似系数(Jaccard similarity coefficient)用于比较有限样本集之间的相似性与差异性。Jaccard系数值越大,样本相似度越高。
两个集合A和B交集元素的个数在A、B并集中所占的比例,称为这两个集合的杰卡德系数,用符号 J(A,B) 表示。
当集合A,B都为空时,J(A,B)定义为1。
是用来衡量两个样本相似度的指标。
Jaccard系数只关心个体间共同具有的特征是否一致这个问题。
可用于用于数据聚类,特别适合于应用到稀疏度过高的数据。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。