当前位置:   article > 正文

python-pd.DataFrame 总结备忘

pd.dataframe

1. 去重

对df1进行去重操作(去除完全重复的行数据):df1 = df1.drop_duplicates()

对df1的指定若干字段去重操作:df.drop_duplicates(subset=['col_name1','col_name2'],keep='first',inplace=True)

  1. subset: 列名,可选,默认为None
  2. keep:枚举为{'first', 'last', False}
                          'first' - str 去重后保留第一次出现的行,删除后面的所有重复行
                           'last' - str 去重后保留最后出现的行,删除前面的所有重复行
                           False - bool 删除所有重复行,不保留任何一个重复行
  3. inplace:布尔值,是否在原数据上执行去重操作 默认值为False-不在原数据上操作,返回一个修改后的值;Ture-修改原数据

2. 对列(字段)的操作

  • 获得列名称

col_list = list(df)  获得df的列名称列表 [str]

df1.columns  获得df的列索引,类型为 pandas.core.indexes.base.Index   可使用list()将其转变为列表

  • 重命名列名称

使用如下语句 df1.columns = ['ca', 'cb', 2]    # 该语句的d

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/153071
推荐阅读
相关标签
  

闽ICP备14008679号