赞
踩
在Pandas的DataFrame中添加一行或者一列,添加行有df.loc[]
以及df.append()
这两种方法,添加列有df[]
和df.insert()
两种方法, 下面对这几种方法的使用进行简单介绍。
一、添加行
loc[]
方法- # 构造一个空的dataframe
- import pandas as pd
- df = pd.DataFrame(columns=['name','number'])
- # 采用.loc的方法进行
- df.loc[0]=['cat', 3] # 其中loc[]中需要加入的是插入地方dataframe的索引,默认是整数型
- # 也可采用诸如df.loc['a'] = ['123',30]的形式
采用loc[]
方法多适用于对空的dataframe循环遍历添加行,这样索引可以从0开始直到数据结果,不会存在索引冲突的问题。
append()
方法- # 1. 采用append方法合并两个dataframe
- # 构造两个dataframe
- df = pd.DataFrame([[1, 2], [3, 4]], columns=list('AB'))
- df2 = pd.DataFrame([[5, 6], [7, 8]], columns=list('AB'))
- # 合并 ignore_index设置为 True可以重新排列索引
- df.append(df2, ignore_index=True)
- A B
- 0 1 2
- 1 3 4
- 2 5 6
- 3 7 8
-
- # 2. 采用append方法添加多行
- df = pd.DataFrame(columns=['A'])
- for i in range(5):
- df = df.append({'A': i}, ignore_index=True)
- df
- A
- 0 0
- 1 1
- 2 2
- 3 3
- 4 4
- # 同样如果是遍历添加多行,有一种更高效的方法
- pd.concat([pd.DataFrame([i], columns=['A']) for i in range(5)],
- ignore_index=True)
- A
- 0 0
- 1 1
- 2 2
- 3 3
- 4 4
二、添加列
df[]
方法直接在列上操作- # 新建一个dataframe
- df = pd.DataFrame(columns=['name','number'], data=[['cat',3]])
- df
- name number
- 0 cat 3
- # 添加一列,计算有多少条腿
- df['leg'] = df['number'] * 4
- # 添加一列,直接赋值有几个头
- df['head'] = 1
- df
- name number leg head
- 0 cat 3 12 1
insert()
方法- # 使用方法是DataFrame.insert(loc, column, value, allow_duplicates=False)
- # 即df.insert(添加列位置索引序号,添加列名,数值,是否允许列名重复)
- df.insert(1, 'tail', 1, allow_duplicates=False)
- df
- name tail number leg head
- 0 cat 1 3 12 1
不过在使用insert的过程中发现454: DeprecationWarning: `input_splitter` is deprecated since IPython 7.0, prefer `input_transformer_manager`. status, indent_spaces = self.shell.input_splitter.check_complete(code)
这个提示,猜测该方法可能已经过时了,不提倡使用了。
主要参考资料:
作者:王叽叽的小心情
链接:https://www.jianshu.com/p/936ad27d9865
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。