赞
踩
图是一种表示两两对象之间的抽象数据结构,使用顶点与边进行表示,图计算就是在基于图数据上进行有目的性和针对性的计算过程,指解决一系列问题和发现潜在的数据价值,而图算法是图计算中用于解决指定问题的核心。
杰卡德相似度使用杰卡德系数(Jaccard Index)进行衡量,用于比较有限样本集之间的相似性与差异性。杰卡德系数值越大,样本相似度越高。杰卡德系数的计算公式如下:
图数据中,顶点与顶点之间采用边的方式连接,那么任意一个顶点的邻接顶点可看为其可比较的有限样本集。
如图上所示,该图是一个有向图,可以按照方向来计算顶点之间的相似程度。
计算顶点1和顶点2的相似度:
杰卡德相似度算法是图论相似度中一种简单,执行效率高,针对行为分析和推荐是一种精确度比较高的算法,该算法可单机实现,也非常容易扩展到分布式系统,对于超大图某类标签顶点的相似度度量,分布式实现可分为单源杰卡德相似度和all pairs-杰卡德相似度。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。