当前位置:   article > 正文

Python Pandas操作Excel 01_pandas 指定表頭

pandas 指定表頭

1.1 Pandas操作Excel 01


1.1.1 数据类型和新建文件

我们用pandas,操作的常见数据类型有:csv txt excel sql

数据.to_csv() 可以新建一个 csv 文件
数据.to_excel() 可以新建一个 excel 文件
数据.to_sql() 可以新建一个 sql 文件

在我们 新建文件之前,肯定要学习 如何封装相应的数据。

pd.DataFrame() 封装成一个二维数据表

import pandas as pd

二维数据表 = pd.DataFrame({'序号':[1,2,3],'姓名':['a','b','c']})
二维数据表 = 二维数据表.set_index('序号')
二维数据表.to_excel('1.xlsx',)
print('新建 1.xlsx 成功')

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

二维数据表 = 二维数据表.set_index('序号') 我们把索引列 设置为 我们提供的一列 Key,这样就不会 出现 默认索引列了。
在这里插入图片描述

pd.Series() 封装一个一维数据表


1.2.1 读取 txt 和 csv 文件

read_csv() 默认以 文本内容的逗号为分隔符
在这里插入图片描述

import pandas as pd

读取数据 = pd.read_csv('1.csv')

print(读取数据)
  • 1
  • 2
  • 3
  • 4
  • 5

在这里插入图片描述

read_table() 默认以 文本内容的 \t 制表符为 分隔符

import pandas as pd

# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',')
print(读取数据)
print(读取数据2)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

在这里插入图片描述
如果文本内容 的分隔符 跟我们 用的这两个方法没有一个是对应的,就需要 告诉方法 我们的 分隔符是什么。


1.2.2 认识 read_csv() 的参数

参数描述
sep分隔符,字符串或正则表达式 都支持
header表头的行号设置为什么,以哪个行号为表头。如果没有表头应该写 None
names配合 header=None 使用,创建一行 新的表头
index_col设置索引为哪一列,可以是 表头名,或 列号
skiprows从文件开始处,需要跳过的行数或行号列表。[2,3] 跳过 2 号行和3号行,如果直接提供一个数字,那么就是从读取处开始 跳过多少行数据。
encoding编码,例如 utf-8
nrows从文件开头处 读入的行数,限制我们 读几行。

① 比如我们把 1 号行,设置为 表头

import pandas as pd

# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=1)
print(读取数据)
print(读取数据2)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

在这里插入图片描述
② 创建一个新表头

import pandas as pd

# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'])
print(读取数据)
print(读取数据2)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

在这里插入图片描述

③ 过滤掉 前 1行

import pandas as pd

# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'])
print(读取数据)
print(读取数据2)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

在这里插入图片描述
④ 过滤掉 1 号 行

import pandas as pd

# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'],skiprows=[1])
print(读取数据)
print(读取数据2)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

在这里插入图片描述

⑤ 把 字段1 当为索引列

import pandas as pd

# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'],index_col='字段1',skiprows=1)
print(读取数据)
print(读取数据2)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

在这里插入图片描述

⑥ 读取前 两行

import pandas as pd

# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'],index_col='字段1',skiprows=1,nrows=2)
print(读取数据)
print(读取数据2)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

在这里插入图片描述


1.2.3 数据对象的一些方法

数据obj.head(读取的行数) 读取前几行数据
在这里插入图片描述

数据obj.shape 返回 数据表的 行数和列数
在这里插入图片描述

数据obj.columns 返回 数据表的 表头 ,装在一个列表里
在这里插入图片描述

数据obj.index 返回索引数据,比如从哪里开始,到哪里结束,步长是多少。
在这里插入图片描述

数据obj.dtypes 返回 每一列or每一个字段的数据类型。即各个表头名 里面 存储的数据 大致是什么类型的。
在这里插入图片描述


1.3.1 .txt 文件 .csv 文件

import pandas as pd

txt数据 = pd.read_csv(txt文件路径)
txt数据.to_csv(csv文件的存储路径)
  • 1
  • 2
  • 3
  • 4

就很简单,这样直接 进行 转换就行。


1.4.1 读取 mysql 文件

import pymysql
import pandas as pd

连接对象 = pymysql.connect(host='localhost',user='root',password='123123',database='tempdata')

# 创建一个 模拟 sql 语句操作者 的对象(游标对象)
游标对象 = 连接对象.cursor()

数据表  = pd.read_sql('select * from `基本信息表`',con=连接对象)

print(数据表)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

在这里插入图片描述
在这里插入图片描述


1.5.1 读取 Excel 文件

import pandas as pd

数据表 = pd.read_excel('1.xlsx')
print(数据表)
  • 1
  • 2
  • 3
  • 4

在这里插入图片描述

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号