当前位置:   article > 正文

Python pandas 染色体 SNP 位点提取 并排序_提取某一位点的碱基时cigar字符串的操作

提取某一位点的碱基时cigar字符串的操作
import pandas as pd
from pandas import DataFrame as df

f = open('C:\\Users\\windows10\\Desktop\\Python练习\\文本流\\1177genetype_hapmapcp1_18_01.txt')
d0 = pd.read_table(f, sep = "\t") #header 默认为第一行
d0.shape  #展示数据框的  行数和列数,如果数据为1,则对sep重新设置进行调节
d01 = d0[d0.chrom == 1]  #,提取1号染色体上的所有位点,染色体1 不可加‘’,以为已经为字符串型,等同于d02 = d0[d0.iloc[:,2] == 1]
print(d01)
d01.head()
d02 = d01.sort_values(by= 'pos')    #按照POS排序
d02.head(20)
d02.shape           #查看数据的  行数、列数
d02.to_csv("C:\\Users\\windows10\\Desktop\\Python练习\\文本流\\chrom1.csv")
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/202183?site
推荐阅读
相关标签
  

闽ICP备14008679号