赞
踩
目录
1、pandas.DataFrame.to_csv() 函数语法
sep:默认以逗号分隔
header:是否包含表头
df = pd.read_csv('data.csv', sep='\t',header=None, names=['var_code','var_name','var_desc'])
- pandas.DataFrame.to_csv(path_or_buf= None,
- sep= ",",
- na_rep= "",
- float_format= None,
- columns= None,
- header= True,
- index= True,
- index_label= None,
- mode= "w",
- encoding= None,
- compression= "infer",
- quoting= None,
- quotechar= '""',
- line_terminator= None,
- chunksize= None,
- date_format= None,
- doublequote= True,
- escapechar= None,
- decimal= ".")
是否加表头和行索引
- index_A = df[df[0] == "<!AAA>"].index.tolist()
- df_A = df.iloc[index_A[0]+1:index_A[1], ]
- print('索引', index_A)
- print(df_A)
- df_A.to_csv('AAA.csv', header=False, index=False, encoding='utf-8-sig')
默认情况下保存文件会保存到和当前执行的文件相同的文件夹中
- a=np.random.random(100)
- a=a.reshape(25,4)
- a=pd.DataFrame(a)
- a.to_csv('G:\\0py\\result\\a.csv')
注意,路径一定要用双斜杠,用单斜杠会报错,原因未知
- import os #获取当前工作路径
- import pandas as pd #将数据保存至相应文件中
-
- file = os.getcwd() + '\\1.csv' #保存文件位置,即当前工作路径下的csv文件
- data = pd.DataFrame({'a':[1, 2, 3], 'b': [4, 5, 6]}) #要保存的数据
- data.to_csv(file, index=False) #数据写入,index=False表示不加索引
-
- #新数据,与data具有相同的和列与列名
- data2 = pd.DataFrame({'a':[7, 8, 9], 'b': [1, 2, 3]})
- #保存至file文件中,index=False表示文件中不添加索引,header=False表示不添加列名,mode='a+'表示在已有数据基础上添加新数据,并不覆盖已有数据
- data2.to_csv(file, index=False, mode='a+', header=False)
直接用pd.to_excel()指定sheet_name时,即使指定sheet_name也没用,后一次的写入数据会覆盖前一次写入的数据,解决方法如下,借助pandas中的ExcelWriter方法;
- 1 # 方法1,推荐方法
- 2 with pd.ExcelWriter('test.xlsx') as writer:
- 3 data.to_excel(writer, sheet_name='data')
- 4 data2.to_excel(writer, sheet_name='data2')
- 5
- 6 # 写法2
- 7 writer = pd.ExcelWriter('test.xlsx')
- 8 data.to_excel(writer, sheet_name='data')
- 9 data.to_excel(writer, sheet_name='data2')
- 10 writer.save()
- 11 writer.close()
解决办法:只需在后面加上 encoding='utf_8_sig'
df.to_csv('F:\\test\\688019.csv', index=False, encoding='utf_8_sig')
- 'utf-8' 和 'utf_8_sig' 的区别:
- ”utf-8“ 是以字节为编码单元,它的字节顺序在所有系统中都是一样的,没有字节序问题,因此它不需要BOM,所以当用"utf-8"编码方式读取带有BOM的文件时,它会把BOM当做是文件内容来处理。
- "uft-8-sig"中sig全拼为 signature 也就是"带有签名的utf-8", 因此"utf-8-sig"读取带有BOM的"utf-8文件时"会把BOM单独处理,与文本内容隔离开。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。