当前位置:   article > 正文

Pandas:DataFrame的行列操作_dataframe 整列 操作

dataframe 整列 操作
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
data = {'数量':[3,2,5],
       '价格':[10,9,8]}
  • 1
  • 2
  • 3
  • 4
  • 5

一、创建时指定行和列索引及其顺序

在指定列索引时,若该列不存在,则初始化该列为NaN

df = DataFrame(data,columns=['品种','价格','数量'],index=['苹果','梨','草莓'])
print(df)
  • 1
  • 2
     品种  价格  数量
苹果  NaN  10   3
梨   NaN   9   2
草莓  NaN   8   5
  • 1
  • 2
  • 3
  • 4

二、获取DataFrame的列

1.字典的方式

print(df['数量'])
  • 1
苹果    3
梨     2
草莓    5
Name: 数量, dtype: int64
  • 1
  • 2
  • 3
  • 4

2.属性的方式

print(df.数量)
  • 1
苹果    3
梨     2
草莓    5
Name: 数量, dtype: int64
  • 1
  • 2
  • 3
  • 4

三、获取DataFrame的行

直接使用切片获取

print(df[:1])
  • 1
     品种  价格  数量
苹果  NaN  10   3
  • 1
  • 2

四、同时操作行和列:loc和iloc

1.按标签存取数据:loc

print(df.loc['苹果','价格'])
  • 1
10
  • 1
print(df.loc['梨':,'价格':])
  • 1
    价格  数量
梨    9   2
草莓   8   5
  • 1
  • 2
  • 3

2.按位置存取数据:iloc

print(df.iloc[0,1])
  • 1
10
  • 1
print(df.iloc[1:,1:])
  • 1
    价格  数量
梨    9   2
草莓   8   5
  • 1
  • 2
  • 3

五、创建列

df['产地'] = ['新西兰','美国','中国']
print(df)
  • 1
  • 2
     品种  价格  数量   产地
苹果  NaN  10   3  新西兰
梨   NaN   9   2   美国
草莓  NaN   8   5   中国
  • 1
  • 2
  • 3
  • 4

六、删除列

del df['品种']
print(df)
  • 1
  • 2
    价格  数量   产地
苹果  10   3  新西兰
梨    9   2   美国
草莓   8   5   中国
  • 1
  • 2
  • 3
  • 4

七、修改列值

df['价格'] = np.arange(2,5)
print(df)
  • 1
  • 2
    价格  数量   产地
苹果   2   3  新西兰
梨    3   2   美国
草莓   4   5   中国
  • 1
  • 2
  • 3
  • 4

八、转置:对换行列索引

print(df.T)
  • 1
     苹果   梨  草莓
价格    2   3   4
数量    3   2   5
产地  新西兰  美国  中国
  • 1
  • 2
  • 3
  • 4

九、为行(index)和列(columns)索引的name属性赋值

df.index.name = '水果'
df.columns.name = '信息'
print(df)
  • 1
  • 2
  • 3
信息  价格  数量   产地
水果             
苹果   2   3  新西兰
梨    3   2   美国
草莓   4   5   中国
  • 1
  • 2
  • 3
  • 4
  • 5
声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop】
推荐阅读
相关标签
  

闽ICP备14008679号