赞
踩
我们用pandas,操作的常见数据类型有:csv
txt
excel
sql
数据.to_csv() 可以新建一个 csv 文件
数据.to_excel() 可以新建一个 excel 文件
数据.to_sql() 可以新建一个 sql 文件
在我们 新建文件之前,肯定要学习 如何封装相应的数据。
pd.DataFrame() 封装成一个二维数据表
import pandas as pd
二维数据表 = pd.DataFrame({'序号':[1,2,3],'姓名':['a','b','c']})
二维数据表 = 二维数据表.set_index('序号')
二维数据表.to_excel('1.xlsx',)
print('新建 1.xlsx 成功')
二维数据表 = 二维数据表.set_index('序号') 我们把索引列 设置为 我们提供的一列 Key,这样就不会 出现 默认索引列了。
pd.Series() 封装一个一维数据表
read_csv() 默认以 文本内容的逗号为分隔符
import pandas as pd
读取数据 = pd.read_csv('1.csv')
print(读取数据)
read_table() 默认以 文本内容的 \t 制表符为 分隔符
import pandas as pd
# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',')
print(读取数据)
print(读取数据2)
如果文本内容 的分隔符 跟我们 用的这两个方法没有一个是对应的,就需要 告诉方法 我们的 分隔符是什么。
参数 | 描述 |
---|---|
sep | 分隔符,字符串或正则表达式 都支持 |
header | 表头的行号设置为什么,以哪个行号为表头。如果没有表头应该写 None |
names | 配合 header=None 使用,创建一行 新的表头 |
index_col | 设置索引为哪一列,可以是 表头名,或 列号 |
skiprows | 从文件开始处,需要跳过的行数或行号列表。[2,3] 跳过 2 号行和3号行,如果直接提供一个数字,那么就是从读取处开始 跳过多少行数据。 |
encoding | 编码,例如 utf-8 |
nrows | 从文件开头处 读入的行数,限制我们 读几行。 |
① 比如我们把 1 号行,设置为 表头
import pandas as pd
# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=1)
print(读取数据)
print(读取数据2)
② 创建一个新表头
import pandas as pd
# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'])
print(读取数据)
print(读取数据2)
③ 过滤掉 前 1行
import pandas as pd
# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'])
print(读取数据)
print(读取数据2)
④ 过滤掉 1 号 行
import pandas as pd
# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'],skiprows=[1])
print(读取数据)
print(读取数据2)
⑤ 把 字段1 当为索引列
import pandas as pd
# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'],index_col='字段1',skiprows=1)
print(读取数据)
print(读取数据2)
⑥ 读取前 两行
import pandas as pd
# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'],index_col='字段1',skiprows=1,nrows=2)
print(读取数据)
print(读取数据2)
数据obj.head(读取的行数)
读取前几行数据
数据obj.shape
返回 数据表的 行数和列数
数据obj.columns
返回 数据表的 表头 ,装在一个列表里
数据obj.index
返回索引数据,比如从哪里开始,到哪里结束,步长是多少。
数据obj.dtypes
返回 每一列or每一个字段的数据类型。即各个表头名 里面 存储的数据 大致是什么类型的。
转
.csv 文件import pandas as pd
txt数据 = pd.read_csv(txt文件路径)
txt数据.to_csv(csv文件的存储路径)
就很简单,这样直接 进行 转换就行。
import pymysql
import pandas as pd
连接对象 = pymysql.connect(host='localhost',user='root',password='123123',database='tempdata')
# 创建一个 模拟 sql 语句操作者 的对象(游标对象)
游标对象 = 连接对象.cursor()
数据表 = pd.read_sql('select * from `基本信息表`',con=连接对象)
print(数据表)
import pandas as pd
数据表 = pd.read_excel('1.xlsx')
print(数据表)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。