赞
踩
传统机器学习(特征工程):抽取D个特征编码成D维向量,再使用机器学习算法进行训练和预测
图表示学习:
嵌入d维空间:
编码器:输入一个节点,输出这个节点的D维向量
解码器:输入这个节点的d维向量,输出节点相似度,向量点乘数值反映节点的相似度(需要人为定义)
优化目标:迭代优化每个节点的d维向量,使得图中相似节点向量数量积大,不相似节点向量数量积小
最简单的编码器:查表(浅编码器),采用独热编码,Z表示一个矩阵,每一列表示一个节点,行数表示向量的维度
优化Z矩阵的方法:DeepWalk、Node2Vec
基于节点相似度
目标:对进行优化迭代每个节点的D维向量,使得使得图中相似节点向量数量积大,不相似节点向量数量积小
直接优化嵌入向量,使用随机游走方式,如果两个节点出现在同一个随机游走序列中,就反映了这两个节点是相似的,并与下游任务无关
随机游走:可以定义具体的策略,在图中进行游走
图机器学习可以和NLP对应:
P
(
v
∣
z
u
)
P(v\vert z_u)
P(v∣zu)从u节点触发的随机游走序列经过v节点的概率
具体步骤:
优点:表示能力、计算便捷、无监督/自监督学习问题
有偏二阶随机游走
通过两个超参数p和q控制随机游走的方向,其中概率
1
p
\dfrac{1}{p}
p1表示退回上一个节点,概率
1
q
\dfrac{1}{q}
q1
表示走向更远的节点,1表示走向上一个节点距离相等的节点
设置不同的超参数:
Node2Vec算法:
通过邻接矩阵分解,可得:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。