赞
踩
此教程写给像博主一样的小白,欢迎各路大神批评指正
GWAS全称“全基因组关联分析”,使用统计模型找到与性状关联的位点,用于分子标记选择(MAS)或者基因定位。
简单来讲,就是找出基因中哪些序列变异(SNP)与疾病相关。即就是统计一个数,找出与表型最有显著性意义的那些基因(位点)。分析方法有:逻辑回归(表型数据为二元);线性回归(表型数据为连续性变量);表型数据正态分析(如果不是正态分布,需转换处理为正态分布)。
R包、plink和EMMAX都可以做GWAS,但是据说后两者做GWAS更快,更容易写出pipeline。以及实验室师兄师姐均采用plink,因此选择学习这个工具。
#plink介绍
PLINK是一个免费的开源全基因组关联分析工具集,在SNP数据统计,过滤,GWAS分析中都可以用得上,而且计算速度很快。直接去百度上搜索plink就可以很容易就找到plink官网(http://www.cog-genomics.org/plink2)功能大概有以下几种:
此时在终端中直接输入plink不可行哦
电脑会告诉你没有plink这个命令-bash: plink: command not found
./plink --help
./plink --vcf Arab.vcf --allow-extra-chr --maf 0.05 --recode --out Arab
vim .bash_profile
#然后按i键进入编辑模式,输入以下语句,其中路径为解压plink的文件夹路径
export PATH=/Users/limingzhu/Downloads/plink_mac_20200428:$PATH
#输完后回车,按ESC
:w #表示保存
:q #表示退出
source .bash_profile #更新即可
之后即可在终端中直接调用plink命令啦!!冲鸭!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。