赞
踩
转载于博主flash胜龙的文章,感谢博主的总结与分享。
一、选取几列组成新的dataframe:
df = df[['A列列名', 'S列列名', 'H列列名']]
二、选取某列'STATUS'里面元素为"ACTIVE"的行,即删掉列STATUS元素不是ACTIVE的行
df = df[df['STATUS'] == "ACTIVE"]
(单项条件搜索,类似SELECT ALL WHERE df.STATUS = ACTIVE)
三、选取'BADTHING'列为元素空的行,即去掉BADTHING所在列中的空行所在行数据,组成一个新的dataframe
df = df[df['BADTHING'].isnull()]
(空值搜索)
四、选取GOODREASON列元素为列表['quality', 'cheap']内元素的行,即可用特定列表内容进行筛选
df = df[df['GOODREASON'].isin(['quality', 'cheap'])]
(多项条件搜索,类似SELECT ALL WHERE df.GOODREASON= quality AND cheap)
五、分组并进行遍历,运用groupby和for:
groupByNew = df.groupby('CITY', sort=False)
for name, groupData in groupByNew:
# TODO …
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。