当前位置:   article > 正文

Causal Discovery in Knowledge Graphs by Exploiting Asymmetric Properties of Non-Gaussian Distributio_知识图谱因果推理

知识图谱因果推理

研究问题

在知识图谱中发现变量之间的因果序,将知识图谱上的矩阵分解和基于矩阵的因果发现算法做了一个结合

背景动机

  • 知识图谱上一些三元组的存在会对另一些三元组的存在产生影响,这种统计依赖性为因果发现提供了可能。论文特别说明假设不存在混杂因素,所有变量都被观测到了
  • 因果发现有助于提升推理的可解释性
  • 其他在知识图谱上做因果推断的算法需要一些领域知识,本文算法不需要

模型思想

第一步是使用TuckER算法对知识图谱上的邻接张量做矩阵分解,得到核心张量;然后对核心张量经过投影和维度变换得到一个数据矩阵;然后验证数据矩阵的非高斯性,并将其作为DirectLiNGAM因果发现算法的输入计算因果序

模型框架

  • TuckER算法

对于输入张量在这里插入图片描述,算法将其分解为一个核心张量在这里插入图片描述以及因子矩阵A、B、C,并满足在这里插入图片描述

在知识图谱问题上,假设实体对应的嵌入矩阵为E,在这里插入图片描述,在这里插入图片描述为实体和关系的数量,在这里插入图片描述为实体和关系的维度,分解之后有在这里插入图片描述在这里插入图片描述,可以得到一个核心张量在这里插入图片描述。给定一个三元组,其可能存在的概率为在这里插入图片描述

  • 矩阵映射

在这里插入图片描述,由于在这里插入图片描述,且DirectLiNGAM接受二维矩阵作为输入,将其转换为在这里插入图片描述

  • DirectLiNGAM
    • 前置知识一:因果序

这里首先要给出对数据的假设,对于可观测变量在这里插入图片描述,如果将它们按因果序在这里插入图片描述排列,则序列中位于后面的变量无法对前面的变量施加因果影响,一种线性的数据构造方式是

在这里插入图片描述

注意噪音项要服从非高斯分布

  • 前置知识二:非高斯数据在统计量上的非对称性

    为了发现因果结构,数据的二阶统计量是不够用的,因为它不能指明方向性,比如皮尔逊相关系数就是对称的。因此一般用高阶统计量来获取方向性,论文里面的例子是标准四阶中心矩,也称之为峰度,定义为

    在这里插入图片描述

    两个变量之间的四阶皮尔逊相关系数是有方向的,定义为

    在这里插入图片描述

由于峰度本质上定义了数据分布相对于正态分布的陡缓程度,如果数据服从正态分布,则在这里插入图片描述,因此数据被要求服从非高斯分布。因此当噪音项服从非高斯分布或者函数方程满足非线性约束时,由于原因变量和噪音项间的独立性仅在正确的因果方向下成立,使得变量间的因果方向是可判定的。

  • 前置知识三:LiNGAM算法

    LiNGAM算法用独立成分分析法来完成因果发现,其最终求解出一个矩阵B,满足 在这里插入图片描述

论文中指出LiNGAM算法容易收敛到局部最优,并且会学到不正确的因果序,因此最终采用了DirectLiNGAM算法

独立主成分分析技术(ICA)被用于LiNGAM 的模型选择,由于超参数选择问题,ICA 算法常常陷入局部最优而无法收敛于最优解。为此,DirectLiNGAM 算法利用外部变量及非外部变量在其上的回归残差间的独立性信息求解变量间的因果结构,被证明可以收敛于最优。

  • 混合算法

比较简单,就是把上面的方法线性拼接

在这里插入图片描述

实验部分

论文里面说目前没有类似的任务,无法量化模型的性能,只能画一下因果图看看效果。

在这里插入图片描述

评价

模型的思路还是比较简单的,就是把两个算法拼起来,中间加一个对矩阵的投影。LiNGA和之前看的DAG求解论文虽然思路不一样,但最终的求解目标是一致的,不知道DAG方法在这上面表现如何。另外论文里面对TuckER算法里面各个矩阵的含义没有说得很清楚,还需要再找找资料理解一下。论文的一个硬伤是无法知道学习到的因果图准不准,也没有将它用于提升后续的推理任务。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/运维做开发/article/detail/875318
推荐阅读
  

闽ICP备14008679号