赞
踩
import pandas as pd
from pandas import DataFrame as df
f = open('C:\\Users\\windows10\\Desktop\\Python练习\\文本流\\1177genetype_hapmapcp1_18_01.txt')
d0 = pd.read_table(f, sep = "\t") #header 默认为第一行
d0.shape #展示数据框的 行数和列数,如果数据为1,则对sep重新设置进行调节
d01 = d0[d0.chrom == 1] #,提取1号染色体上的所有位点,染色体1 不可加‘’,以为已经为字符串型,等同于d02 = d0[d0.iloc[:,2] == 1]
print(d01)
d01.head()
d02 = d01.sort_values(by= 'pos') #按照POS排序
d02.head(20)
d02.shape #查看数据的 行数、列数
d02.to_csv("C:\\Users\\windows10\\Desktop\\Python练习\\文本流\\chrom1.csv")
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。