赞
踩
在实际业务处理中,数据通常是脏数据。所谓的脏,指数据可能存在以下几种问题(主要问题):
- import pandas as pd
- import numpy as np
- data=pd.read_csv('path',sep=',' ,header = 0,encoding='gbk',usecols=['col1','col2','col3'])#导入数据,把path改成文件路径;数据中有中文的话,就用encoding='gbk',没有中文的话就用encoding='utf-8';usecols是可以让我们选择哪几列
- data.head()#查看前五行
- data.i
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。