赞
踩
本文转载于以下博客地址:https://blog.csdn.net/hy_jz/article/details/78862226
如有冒犯,还望谅解!
Meta Path 是2011年 Yizhou Sun etc. 提出的 http://www.morganclaypool.com/doi/abs/10.220/S00433ED1V01Y201207DMK005, 针对异质网络中的相似性搜索。Meta Path 是一条包含relation序列的路径,而这些 relation 定义在不同类型object之间。
Information Network
信息网络是指一个有向图 G=(V,E), 同时还有一个object类型映射函数 ϕ:V→A,边类型映射函数ψ:E→R。每一个object v∈V, 都有一个特定的object 类型ϕ(v)∈A;每一条边 e∈E 都有一个特定的relation ψ(e)∈R。
异质网络(Heterogeneous Network)指的是object的类型|A|>1或者relation的类型|R>1|。
Network Schema
Network schema,定义为:TG=(A,R),是信息网络 G=(V, E)的一种 meta模板,这个信息网络有一个object类型映射函数 ϕ:V→A 和 link 类型映射函数ψ:E→R。信息网络G是一个定义在object类型A上的有向图,并且边是R 中的relation。
Meta-Path
Meta Path P定义在 network schema TG=(A,R)上,具体形式为A1⟶R1A2⟶R2⋯⟶RlAl+1这其实是在节点类型A1,Al+1
之间定义了一个组合关系R=R1∘R2∘⋯∘Rl。∘代表着relation之间的组合操作。如果在v1,vl+1之间的路径 p=(v1,v2,⋯,vl+1)服从metapath P,那么它必须满足 ∀i,ϕ(vi)=Ai,并且每一个link ei=<vi,vi+1>属于 P 中对应的Ri。meta-path P的返定义为 P−1。两个meta-path P1=(A1,A2,⋯,Al)和 P2=(A′1,A′2,⋯,A′k)可以拼接,当且仅当 Al=A′1。拼接后的路径是P=(P1,P2),等价(A1,A2,⋯,Al,A′2,⋯,A′k)给定一个用户指定的meta-path P=(A1,A2,⋯,Al), 那么在节点对 x∈A1,y∈Al 上,根据他们之间符合P的路径实例,可以定义几个相似性指标:
Path Count:在节点x,节点y之间符合meta-path P的路径实例p的数目:s(x,y)=|p:p∈P|。
Random Walk: s(x,y)是从x节点开始,到y节点结束,服从P的random walk概率。s(x,y)=∑p∈PProb(p)。
Pairwise Random Walk: 一个meta-path P 可以被分解为两个较短的但是等长的路径 P=(P1P2), 那么s(x,y)就是从x,y开始到达相同的中间节点的 节点对随机游走 概率。s(x,y)=∑(p1p2)∈(P1P2)Prob(p1)Prob(p−12),其中 Prob(p1) 和 Prob(p−12)是两条路径实例的随机游走概率。
PahtSim 相似性度量
Path Count 和基于Random Walk 的相似性总是倾向于度大的节点;而Pairwise Random Walk 相似性倾向于集中的(concentrated)节点,即:大多数link连接到一小部分节点。对于PathSim,两个节点相似不仅仅是直接相连的节点,也共享可比的可视性(comparable visibility)。由于对等(peer)关系应该是对称的,因此我们将PathSim 简称为对称元路径。
s(x,y)=2×|{px⇝y:px⇝y∈P}||{px⇝x:px⇝x∈P}|+|{py⇝y:py⇝y∈P}|
---------------------
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。