赞
踩
利用PLINK对单基因控制的性状进行定位,之前一篇文章粗滤的记录了一下使用PLINK的命令,本次博客主要记录一下如何根据SNP芯片的数据制作PLINK的格式,以及分析的步骤,最后数据的可视化。
首先,有的公司给的新片的数据就是一个excel表格,列表示的是样品,行表示的是基因型,基因型用ATCG构成,当然有的基因型是用数字0或者1表示的。下面我拿到的一个数据是15个样品构成的基因型,有13个样品是突变体,2个样品是野生型。 格式如下:
第二步:将此基因型存成csv文件,使用R进行读取,在R中制作plink所需要的两个文件,plink.map 和plink.ped. 其中map文件包含了四列,分别是染色体,SNP名词,遗传位置,SNP物理位置。没有遗传距离的可以全部写成0. ped 文件的包涵了family ID, individual ID, Paternal ID,Maternal ID,Sex (1=male; 2=female; other=unknown),phenotype, 以及每个材料的基因型,每个基因型需要将2个allele 分开写。 对于植物,family ID,Paternal ID,Maternal ID,Sex (1=male; 2=female;
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。