赞
踩
取列
1.通过列名称来提取指定列(推荐)
#列名:irline_sentiment_gold name negativereason_gold retweet_count text
get_data=data[['airline_sentiment','text']]
2.通过loc函数传入列名称来获取列
loc : location 指定列名的位置
data.loc[:,'text'] #获取列名为text的那一列
3.通过iloc函数传入默认索引切片获取列
iloc : integer-location 整数位置,也就是索引方式来获取所需要的列
df.iloc[:,0] #获取第一列
取行
1.通过索引切片取(推荐)
data[0:3] #取索引0,1,2行
2.通过loc函数默认索引值来取(不推荐)
data.loc[0:3] #取索引 0,1,2,3行
注意区别,行列索引,以及默认pandas给的索引值。如下图,我们数据存储本身起始列是tweet_id,但是pandas读取后会默认给一个递增的索引id,这个就是索引值。通过loc就是通过值来切。
iloc带i的可以理解通过行或者列本身的索引顺序(从0开始,0表示第一行或者第一列)来确定位置。
loc可以理解通过默认pandas索引值来确定位置,仅在获取行时使用。0:3表示默认索引值0-3行。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。