当前位置:   article > 正文

孟德尔随机化(三)—— 再也不用担心网络或其他各种报错啦 | 从数据库下载数据到本地的数据处理方法_孟德尔用在线方法提取的数据是已经处理过的吗

孟德尔用在线方法提取的数据是已经处理过的吗

前几天咱们分享了看完不会来揍我 | 孟德尔随机化万字长文详解(二)—— 代码实操 | 附代码注释 + 结果解读,很多小伙伴们反映在使用代码下载数据时会遇到各种网络或其他报错问题,令人头大的那种!不要慌!从数据库下载数据到本地的数据处理方法这就来啦!



直接开始!

数据要求

在进行**孟德尔随机化(Mendelian Randomization,MR)**分析时,关于曝露因子的 GWAS 数据,TwoSampleMR需要一个工具变量数据框,要求每行对应一个 SNP,至少需要 4 列最基本信息,包括:

我们也可以提供以下对 MR 有用的其他信息:

  • other_allele - 非效应等位基因
  • eaf - 效应等位基因频率
  • Phenotype - SNP具有效应的表型名称

我们还可以提供以下额外信息(非必须):

  • chr - SNP 所在的染色体
  • position - SNP 在染色体上的位置
  • samplesize - 用于估计效应大小的样本大小
  • ncase - 病例数量
  • ncontrol - 对照组数量
  • pval - SNP 与曝露因子关联的 P 值
  • units - 以哪种单位呈现效应
  • gene - SNP 的基因或其他注释

注意注意:不同来源的数据可能列名会有些许差异,大家要注意哈!

大家在下载完成后可以检查一下数据是否符合要求,从数据库下载的还好,一般不会有问题,主要是大家从相关文献获取数据的时候要注意这个问题。

从 IEU 数据库获取数据

数据下载

IEU 数据库官网:https://gwas.mrcieu.ac.uk/

我们可以直接在中间的大框框里输入关键词,也可以点击右上角的datasets进入新的页面,在Trait contains的框框里输入关键词。比如我们这里就以body mass index(身体质量指数,也就是咱们常说的 BMI)作为关键词进行输入,然后点击

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/477416?site
推荐阅读
相关标签