当前位置:   article > 正文

孟德尔随机化中的无效工具变量检验

孟德尔cochran's q检验

欢迎关注”生信修炼手册”!

两样本的孟德尔随机化研究只需要基于gwas summary数据,就可以研究暴露因素和结局变量之间的因果关系,是最广泛使用的研究手段之一。要保证MR研究结果的可靠性,需要在分析的各个环节进行有效的质控。

孟德尔随机化研究中以遗传变异为工具变量,而合格的工具变量需要符合以下几个条件

  1. 与暴露因素的强关联,称之为关联性假设

  2. 与混杂因素相独立,称之为独立性假设

  3. 只会通过暴露因素对结局变量造成影响,称之为排他性假设

众所周知,基因具有多效性(pleiotropy effect), 当把具有多效性的基因纳入工具变量的集合时,会对MR的分析结果造成影响。当多效性的基因可以通过混杂因素影响结局变量时,违背了独立性假设;当多效性的基因可以通过代谢通路等其他途径来影响结局变量时,违背了排他性假设。无法满足以上3点的遗传变异,称之为无效的工具变量。

为了确保分析结果的准确性,需要对无效工具变量进行检验, 有多种检验方式,其核心思想是异质性检验, 假设每个工具变量的因果效应估计值是相似的,当存在无效工具变量时,其计算得到的因果效应估计值与有效的工具变量存在较大差异,总体上看就会存在显著的异质性。

在进行无效工具变量的显著性检验时,常用的方法为Cochran’s Q检验,这一检验异质性的方法在meta分析中广泛使用。Q检验适用于处理如下数据

subject表示样本,其他列表示不同的条件。Q检验要求条件的个数要大于等于2,而且每个样本的数值为分二类的数值。其空假设为所有条件下数值的分布相同,其统计量称之为Q, 计算公式如下

其中

N表示样本总数,k表示条件的个数,i表示行,j表示列,Y表示i行j列对应的值。当样本量很大时,Q统计量服从自由度为k-1的卡方分布,对应p值的计算公式如下


当pvalue小于0.05 ,认为异质性不显著。除了Q检验外,还有一种在Q统计量的基础上发展而来的I square统计量,计算公式如下

通常情况下,I square的值在0-0.25之间,认为是较低异质性;0.25-0.5之间,中等程度的异质性,0.5到0.75之间,真实存在异质性,0.75以上,异质性很大。

在MR分析中,为了确保分析结果的可靠性,有必要进行无效工具变量的检验。

·end·

—如果喜欢,快分享给你的朋友们吧—

本公众号深耕耘生信领域多年,具有丰富的数据分析经验,致力于提供真正有价值的数据分析服务,擅长个性化分析,欢迎有需要的老师和同学前来咨询。

  更多精彩

  写在最后

转发本文至朋友圈,后台私信截图即可加入生信交流群,和小伙伴一起学习交流。

扫描下方二维码,关注我们,解锁更多精彩内容!

生物信息入门

只差这一个

公众号

点击下方“阅读原文”,我们一起进步!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/574208
推荐阅读
相关标签
  

闽ICP备14008679号