赞
踩
import matplotlib.pyplot as plt # 导入绘图库
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
data[u'销量'][(data[u'销量'] < 400) | (data[u'销量'] > 5000)] = None # 过滤异常值,将其变为空值
df[][]根据第二个[]中的真值来决定选择
(data['销量'].isnull())[0]
返回真值,表示该列第0行空不空,data['销量'].isnull()返回一个series(list)
from scipy.interpolate import lagrange # 导入拉格朗日插值函数
# 自定义列向量插值函数
# s为列向量,n为被插值的位置,k为取前后的数据个数,默认为5
def ployinterp_column(s, n, k=5):
y = s[list(range(n-k, n)) + list(range(n+1, n+1+k))] # 取数
y = y[y.notnull()] # 剔除空值
return lagrange(y.index, list(y))(n) # 插值并返回插值结果
pandas.read_excel(io,sheet_name=0,header=0,names=None,index_col=None,usecols=None,squeeze=False,dtype=None,engine=None,converters=None,true_values=None,false_values=None,skiprows=None,nrows=None,na_values=None,keep_default_na=True,verbose=False,parse_dates=False,date_parser=None,thousands=None,comment=None,skipfooter=0,convert_float=True,mangle_dupe_cols=True,**kwds)
converters{1:lambda x: "\""+x+"\"",2:lambda x: x-10}
对第2列的所有名称加上"",把第三列的所有年龄都减10true_values=["女"],false_values=["男"]
将性别中的女转换为True,男转换为FalseCopyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。