赞
踩
差异类型 | 数据分析 | 数据挖掘 |
---|---|---|
定义 | 描述和探索性分析,评估现状和修正性不足 | 技术性的“采矿”,过程,发现未知的模式和规律 |
侧重点 | 实际的业务知识 | 涉及到 业务知识 |
技能 | 统计学,数据库,Excel,可视化等 | 过硬的数学功底和编程技术 |
结果 | 需结合业务知识解读统计结果 | 模型或规律 |
A.array
B.func
C.matrix
D.Series
A.np.arange(0,9).reshape(3,3)
B.np.eye(3)
C.np.random.random([3,3,3])
D.np.mat(“1,2,3;4,5,6;7,8,9”)
A.ndim
B.shape
C.size
D.itemsize.
A.对角矩阵
B.三角矩阵
C.值为1的矩阵
D.值为0的矩阵
A.uniform
B.shuffle
C.permutation
D.normal
A.zeros( )
B.arange( )
C.linspace( )
D.logspace( )
A. agg()函数
B. concat()函数
C. join()方法
D. merge()函数
A. merge()方法
B. concat()方法
C. to_datetime()方法
D. set_index()方法
A. 密度图
B. 直方图
C. 盒图
D. 概率图
A. null和notnull可以对缺失值进行处理
B. dropna方法既可以删除观测记录,还可以删除特征
C. fillna方法中用来替换缺失值的值只能是数据框
D. Pandas库中的interpolate模块包含了多种插值方法
A. 忽略
B. 删除
C. 平均值填充
D. 最大值填充
A.pyplot
B.Bar
C.rcparams
D.pprint
A. 绘制简单的图形可以使用缺省的画布
B. 添加图例可以在绘制图形之前
C. 添加x轴,y轴的标签可以在绘制图形之前
D. 修改x轴标签,y轴标签和绘制的图形没有先后
A. lines.linestyle
B. lines.linewidth
C. font.sans-serif
D. axes.unicode_minus
A. 饼图一般用于表示不同分类的占比情况。
B. 箱线图展示了分位数的位置。
C. 散点图无法反映特征间的统计关系。
D. 词云对于文本中出现频率较高的关键词予以视觉上的突出。
(1) 绘图函数:y=sin(x), y=cos(x), x = np.linspace(-np.pi, np.pi, 256, endpoint=True);
(2) 绘制填充区域:
紫色区域:(-2.5<x)&(x<-0.5)
绿色区域:np.abs(x)<0.5,sinx>0.5
紫色的设置:color=‘purple’.
import matplotlib.pyplot as plt import numpy as np plt.rcParams['font.sans-serif']=['SimHei'] plt.rcParams['axes.unicode_minus']=False # 创建x轴数据,从-pi到pi平均取256个点; x = np.linspace(-np.pi,np.pi,256,endpoint=True) # 创建y轴数据,根据X的值,求正弦和余弦函数; sin,cos = np.sin(x),np.cos(x) # 设置正弦函数曲线的颜色为蓝色(blue),线型为实线,线宽为2.5mm; #余弦函数曲线的颜色为红色(red),线型为实线,线宽为2.5mm。 plt.plot(x,sin,"b-",lw=2.5,label="正弦Sin()") plt.plot(x,cos,"r-",lw=2.5,label="余弦Cos()") # 设置坐标轴的范围,将x轴、y轴同时拉伸1.5倍, plt.xlim(x.min()*1.5,x.max()*1.5) plt.ylim(cos.min()*1.5,cos.max()*1.5) # 设置x轴、y轴的坐标刻度, plt.xticks([-np.pi,-np.pi/2,0,np.pi/2,np.pi],[r'$-\pi$',r'$-\pi/2$',r'$0$',r'$\pi/2$',r'$\pi$']) plt.yticks([-1,0,1]) # 为图表添加标题“绘图实例之COS()&SIN()”,字体大小设置为16,字体颜色设置为绿色; plt.title("绘图实例之COS()&SIN()",fontsize=16,color="green") # 在图表右下角位置文本为“python-matplotlib”,文本大小为16,文本颜色为紫色 plt.text(+2.1,-1.4,"python_matplotlib",fontsize=16,color="purple") # 获取Axes对象,并隐藏右边界和上边界; ax=plt.gca() ax.spines['right'].set_color('none') ax.spines['top'].set_color('none') # 将x轴的坐标刻度设置在坐标轴下侧,坐标轴平移至经过零点(0,0)的位置, ax.xaxis.set_ticks_position('bottom') ax.spines['bottom'].set_position(('data',0)) # 将y轴的坐标刻度设置在坐标轴左侧,坐标轴平移至经过零点(0,0)的位置, ax.yaxis.set_ticks_position('left') ax.spines['left'].set_position(('data',0)) # 添加图例,图例位置为左上角,图例文字大小为12, plt.legend(loc="upper left",fontsize=12) # 用绘制散点图的方法在正弦,余弦函数上标注这两个点的位置,设置点大小为50,设置相应的点颜色; t1=-np.pi t2=2*np.pi/3 plt.scatter([t1,],[np.cos(t1),], 50, color ='b') plt.scatter([t2,],[np.sin(t2),], 50, color ='r') # 为图表添加带箭头的注释; plt.annotate(r'$\sin(\frac{2\pi}{3})=\frac{\sqrt{3}}{2}$', xy=(t2,np.sin(t2)), #点的位置 xycoords='data', #注释文字的偏移量 xytext=(+10,+30), #文字离点的横纵距离 textcoords='offset points', fontsize=14, #注释的大小 arrowprops=dict(arrowstyle="->",connectionstyle="arc3,rad=.2")) plt.annotate(r'$\cos(-\pi)=-1$', xy=(t1,np.cos(t1)), #点的位置 xycoords='data', #注释文字的偏移量 xytext=(0,-40), #文字离点的横纵距离 textcoords='offset points', fontsize=14, #注释的大小 arrowprops=dict(arrowstyle="->",connectionstyle="arc3,rad=.2")) # 获取x,y轴的刻度,并设置字体; for label in ax.get_xticklabels()+ax.get_yticklabels(): label.set_fontsize(18) # 绘制填充区域;#设置正弦函数的填充区域,颜色为绿色(green),余弦函数的填充区域,颜色为紫色(purple) plt.fill_between(x, np.abs(x)<0.5, sin, sin>0.5, color='g', alpha=0.8) plt.fill_between(x, cos, where=(-2.5<x)&(x<-0.5), color='purple') # 绘制网格线 plt.grid() plt.show()
A. xlim()
B. ylim()
C. xlabel()
D. xticks()
A. subplots( )
B. add_subplot( )
C. figure( )
D. subplot2grid( )
A. 聚类
B. 一元线性回归
C. 时间序列
D. 多元线性回归
赞
踩
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。