当前位置:   article > 正文

共定位数据和环境准备_locuscomparer

locuscomparer

共定位数据和环境准备

一、数据准备
如果需要做eqtl-GWAS的共定位,则需要按照药靶教程中,将eqtl数据放在smr目录内
如果是纯GWAS-GWAS的共定位,涉及到本地数据的,需要将其整理成模板SNP的格式,并且需要chr,pos,samplesize

在线数据的GWAS会用ieugwasr和gwasglue包进行处理

本地数据如果在下载下来后没有samplesize列,可以使用以下代码进行添加

为本地数据添加samplesize

add_samplesize("文件名.txt", 10000)



二、R包环境准备
MendelR升级到6.0以上后,可以使用prepare_colocalization()方法来准备相关的R包
主要是:
snpStats (用于分析snp的数据)
coloc(共定位主要R包,使用贝叶斯的方法)
locuscomparer(可视化包)
ieugwasr(从mrbase数据库提取数据的接口)
gwasglue(在线ieu数据的处理)

 

 

prepare_colocalization()#准备共定位相关的包


MendelR包集成了上面两种方法的数据预处理,以及各种边界条件的判断和提示,使用时如果有本地数据,则准备好数据在工作目录,然后使用一行代码即可分析出想要的结果

具体使用方法,请移步:

 eQTL-GWAS一键分析

mr_coloc_eqtl2gwas("HMGCR", "ieu-a-300")

        

     一、数据准备

       1.eqtl数据,存放在smr目录

       2.gwas数据,分为在线和本地,

        在线数据不用做任何处理,代码已经做了兼容

        本地数据需要按照模板SNP的格式整理,并且需要有chr,pos,samplesize

流程:

1.从eqtl数据或者这部分基因SNP

2.根据这部分SNP,获取在线数据或者本地数据对应范围的SNP

3.整理数据成coloc的格式

4.进行coloc分析,可视化

三、参数解释

?mr_coloc_eqtl2gwas

使用方法:和smr一键分析的代码类似

特别需要注意的:

gwas_type : gwas表型的类型 cc为分类变量,quant为连续变量

gwas_s: 代表case/samplesize的比值,比如 case1000,samplesize200000,s=1000/200000=0.005

eqtl_samplesize: eqtl数据的样本量,默认eqtlGen 31864



三、共定位引用
locuscomparer画图:
https://github.com/boxiangliu/locuscomparer
If you use locuscompare, please cite the following paper: Abundant associations with gene expression complicate GWAS follow-up | Nature Genetics
Boxiang Liu, Michael J. Gloudemans, Abhiram S. Rao, Erik Ingelsson & Stephen B. Montgomery (2019) Abundant associations with gene expression complicate GWAS follow-up, Nature Genetics

coloc
https://github.com/chr1swallace/coloc

四、图例说明

image.png


左侧的图代表SNP在GWAS和QTL中-log10(p)的分布情况,p值越小越在Y轴上方
右侧两个各自分表代表QTL和GWAS自己的分布情况(横坐标是snp的pos位点位置)
纵坐标代表着SNP在该GWAS/QTL数据中的-log10(p)值,越高代表p值越小,lead SNP是在最顶。
R2为该数据在相应人群中某SNP与lead SNP之间的连锁程度。
主要展示数据中SNP的连锁不平衡情况
标出来的SNP,则是两个数据中PPH4最大的数值,具体每个SNP都有对应H1~H4的数据,查看结果中的共定位数据

标注出来的rsid,是两个数据中pval相加最小的值,即leadSNP

 

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号