赞
踩
1、使用pandas库读取Excel ----- 最常用
pandas可以读取各种各样格式的数据文件,一般输出dataframe格式。
如:txt、csv、excel、json、剪切板、数据库、html、hdf、parquet、pickled文件、sas、stata等等
(1)read_excel方法
读取excel文件,包括xlsx、xls、xlsm格式
import pandas as pd getdata=pd.read_excel('test.xlsx') getdata==pd.read_excel(r'C:/User/83852/Desktop/测试.xlsx') |
(2)to_excel方法
可以将 Dataframe 中的数据写入到 Excel 文件。
import pandas as pd #创建DataFrame数据 info=pd.DataFrame({'name': ['编程帮'], 'language': ['Python' ], 'url': [ 'c.bianchneg.net' ]}) info.to_excel(r'website.xlsx') print('输出成功') |
(3)read_csv方法
read_csv方法用来读取csv格式文件,输出dataframe格式。
import pandas as pd pd.read_csv('test.csv') |
(4)read_json方法
读取json格式文件
df = pd.DataFrame([['a', 'b'], ['c', 'd']],index=['row 1', 'row 2'],columns=['col 1', 'col 2']) j = df.to_json(orient='split') pd.read_json(j,orient='split') |
说明 1、read_excel()函数的语法格式 2、to_excel()函数的语法格式 |
2、读写excel文件(xlrd、xlwt库)
(1)xlrd库:从excel中读取数据,支持xls、xlsx
(2)xlwt库:对excel进行修改操作,不支持对xlsx格式的修改
import xlrd data = xlrd.open_workbook(r'C:\Users\NHT\Desktop\Data\\test1.xlsx') table = data.sheets()[0] |
3、python内置方法(read、readline、readlines)
4、内置模块(csv)
(1)csv模块读取文件
# 读取csv文件 import csv with open('test.csv','r') as myFile: lines=csv.reader(myFile) for line in lines: print (line) |
(2)csv模块写入文件
import csv with open('test.csv','w+') as myFile: myWriter=csv.writer(myFile) # writerrow一行一行写入 myWriter.writerow([7,8,9]) myWriter.writerow([8,'h','f']) # writerow多行写入 myList=[[1,2,3],[4,5,6]] myWriter.writerows(myList) |
5、使用numpy库(loadtxt) ---很少用
(1)loadtxt方法
loadtxt用来读取文本文件(包含txt、csv等)以及.gz 或.bz2格式压缩文件,前提是文件数据每一行必须要有数量相同的值。
import numpy as np np.loadtxt('test.csv',dtype=str) # out:array(['1,2,3', '4,5,6', '7,8,9'], dtype='<U5') # loadtxt()中的dtype参数默认设置为float # 这里设置为str字符串便于显示 |
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。