赞
踩
如果将文本数据与图表数据相比较,人类的思维模式更适合于理解后者,原因在于图表数据更加直观且形象化,它对于人类视觉的冲击更强,这种使用图表来表示数据的方法被叫做数据可视化。
当使用图表来表示数据时,我们可以更有效地分析数据,并根据分析做出相应的决策。在学习 Matplotlib 之前,了解什么是数据可视化!
图表为更好地探索、分析数据提供了一种直观的方法,它对最终分析结果的展示具有重要的作用。
当您对一个数据集进行分析时,如果使用数据可视化的方式,那么您会很容易地确定数据集的分类模式、缺失数据、离群值等等。下图展示了五个常用的数据可视化图表:
对于组织决策者而言,数据可视化也只是一种辅助工具,从寻找数据间关联到最终做出决定,大致分为以下四步。如下图所示:
组织者决策流程图
下面对图中的流程进行简要说明:
可视化(Visualize):使用不同种类的图表对原始数据进行可视化处理,使复杂的数据更容易理解与使用;
分析(Analysis):数据分析的目的是获取有用的信息,这个过程主要涉及对数据的清洗、检查、转换以及对数据的建模;
文档说明(Document insight):文档说明属于整理、汇总阶段,将有用的数据或者信息整理出来;
数据集转换(Transform Data Set):指将数据进行分类、分级、统计记录格式与编码格式等。
数据可视化主要有以下应用场景:
企业领域:利用直观多样的图表展示数据,从而为企业决策提供支持;
股票走势预测:通过对股票涨跌数据的分析,给股民提供更合理化的建议;
商超产品销售:对客户群体和所购买产品进行数据分析,促使商超制定更好的销售策略;
预测销量:对产品销量的影响因素进行分析,可以预测出产品的销量走势。
其实不管是在日常生活,还是工作中,我们都会根据过往的经验作出某些决定,这种做法也叫做“经验之谈”。数据分析和其类似,通过对过往数据的大量分析,从而对数据的未来走势做出预测。
Matplotlib 是一款用于数据可视化的 Python 软件包,支持跨平台运行,它能够根据 NumPy ndarray 数组来绘制 2D 图像,它使用简单、代码清晰易懂,深受广大技术爱好者喜爱。
NumPy 是 Python 科学计算的软件包,ndarray 则是 NumPy 提供的一种数组结构。
Matplotlib 由 John D. Hunter 在 2002 年开始编写, 2003 年 Matplotlib 发布了第一个版本,并加入了 BSD 开源软件组织。Matplotlib 1.4 是最后一个支持 Python 2 的版本,它的最新版本 3.1.1 已于 2019 年 7 月 1 日发布。
图1:Matplotlib 图标
Matplotlib 提供了一个套面向绘图对象编程的 API 接口,能够很轻松地实现各种图像的绘制,并且它可以配合 Python GUI 工具(如 PyQt、Tkinter 等)在应用程序中嵌入图形。同时 Matplotlib 也支持以脚本的形式嵌入到 IPython shell、Jupyter 笔记本、web 应用服务器中使用。
Matplotlib 由三个不同的层次结构组成,分别是脚本层、美工层和后端层。
Matplotlib架构图
脚本层是 Matplotlib 结构中的最顶层。我们编写的绘图代码大部分代码都在该层运行,它的主要工作是负责生成图形与坐标系。
美工层是结构中的第二层,它提供了绘制图形的元素时的给各种功能,例如,绘制标题、轴标签、坐标刻度等。
后端层是 Matplotlib 最底层,它定义了三个基本类,首先是 FigureCanvas(图层画布类),它提供了绘图所需的画布,其次是 Renderer(绘图操作类),它提供了在画布上进行绘图的各种方法,最后是 Event(事件处理类),它提供了用来处理鼠标和键盘事件的方法。
Matplotlib 生成的图形主要由以下几个部分构成:
Figure:指整个图形,您可以把它理解成一张画布,它包括了所有的元素,比如标题、轴线等;
Axes:绘制 2D 图像的实际区域,也称为轴域区,或者绘图区;
Axis:指坐标系中的垂直轴与水平轴,包含轴的长度大小(图中轴长为 7)、轴标签(指 x 轴,y轴)和刻度标签;
Artist:您在画布上看到的所有元素都属于 Artist 对象,比如文本对象(title、xlabel、ylabel)、Line2D 对象(用于绘制2D图像)等。
许多第三方工具包都对 Matplotlib 进行了功能扩展,其中有些安装包需要单独安装,也有一些允许与 Matplotlib 一起安装。常见的工具包如下:
Matplotlib 是 Python 的第三方绘图库,它非常类似于 MATLAB。在使用 Matplotlib 软件包之前,需要对其进行安装。本节以 Windows10 系统为例,介绍 Matplotlib 的几种安装方式。
MATLAB 是一款商业软件,主要用于数据分析、图像处理、计算机视觉等领域。
使用 Python 包管理器 pip 来安装 Matplotlib 是一种最轻量级的方式。打开 CMD 命令提示符窗口,并输入以下命令:
pip install matplotlib
图1:pip安装Matplotlib
安装 Matplotlib 的最好的方法是下载 Python 的 Anaconda 发行版,因为 Matplotlib 被预先安装在 Anaconda 中。安装方法如下:
Anaconda 是一个开源的 Python 发行版本,其包含了 Python、NumPy、Matplotlib 等180多个科学包及其依赖项。
1) 访问 Anaconda 的官方网站(点击前往),然后单击“Download”按钮,如下图所示:
Anaconda官网
2) 根据您的 Python 解释器版本选择相应的 Anaconda 版本下载。
Anconda 中提供了一个交互式笔记本 Jupyter,您可以把它理解为 IPython 的升级本,它拥有比 IPython 更强大的功能,方便您对程序代码的实时调试。
Jupyter 的本质上是一个 Web 应用程序,它支持运行 40 多种编程语言,主要应用于数据可视化、数值模拟、统计建模以及机器学习等。
当您成功安装 Anaconda 后,您可以通过系统的开始菜单找到 Jupyter,然后启动它,Jupyter 界面如下所示:
Jupyter交互式笔记本
Jupyter 使用方法简单,在本教程不做具体介绍,可以参见官网《Jupyter Notbook使用介绍》。
要验证 Matplotlib 是否成功安装,可以在命令提示符窗口执行以下命令:
import matplotlib
matplotlib.version
‘3.1.1’
绘图类型
绘图类型 | |
---|---|
函数名称 | 描述 |
Bar | 绘制条形图 |
Barh | 绘制水平条形图 |
Boxplot | 绘制箱型图 |
Hist | 绘制直方图 |
his2d | 绘制2D直方图 |
Pie | 绘制饼状图 |
Plot | 在坐标轴上画线或者标记 |
Polar | 绘制极坐标图 |
Scatter | 绘制x与y的散点图 |
Stackplot | 绘制堆叠图 |
Stem | 用来绘制二维离散数据绘制(又称为“火柴图”) |
Step | 绘制阶梯图 |
Quiver | 绘制一个二维按箭头 |
Image函数
图像函数 | |
---|---|
函数名称 | 描述 |
Imread | 从文件中读取图像的数据并形成数组。 |
Imsave | 将数组另存为图像文件。 |
Imshow | 在数轴区域内显示图像。 |
Axis函数
Axis函数 | |
---|---|
函数名称 | 描述 |
Axes | 在画布(Figure)中添加轴 |
Text | 向轴添加文本 |
Title | 设置当前轴的标题 |
Xlabel | 设置x轴标签 |
Xlim | 获取或者设置x轴区间大小 |
Xscale | 设置x轴缩放比例 |
Xticks | 获取或设置x轴刻标和相应标签 |
Ylabel | 设置y轴的标签 |
Ylim | 获取或设置y轴的区间大小 |
Yscale | 设置y轴的缩放比例 |
Yticks | 获取或设置y轴的刻标和相应标签 |
Figure函数
Figure函数 | |
---|---|
函数名称 | 描述 |
Figtext | 在画布上添加文本 |
Figure | 创建一个新画布 |
Show | 显示数字 |
Savefig | 保存当前画布 |
Close | 关闭画布窗口 |
import numpy as np
from matplotlib import pyplot as plt
import math
x=np.arange(0,math.pi*2,0.1)
y=np.sin(x)
plt.plot(x,y)
plt.xlabel("angle")
plt.ylabel("sin(angle)")
plt.title("sin")
plt.plot(x,y)
plt.show()
代码执行后,显示结果如下:
sin(angle)正弦函数图像
PyLab 是一个面向 Matplotlib 的绘图库接口,其语法和 MATLAB 十分相近。它和 Pyplot 模快都够实现 Matplotlib 的绘图功能。PyLab 是一个单独的模块,随 Matplotlib 软件包一起安装,该模块的导包方式和 Pyplot 不同,如下所示:
#Pyplot导包方式
from matplotlib import pyplot as plt
#PyLab导包有两种方式
import pylab
from pylab import *
PyLab 是一个很便捷的模块,下面对它的使用方法做相应的介绍。
提供一对相同长度的数组(或序列),然后使用plot()绘制曲线,示例如下:
from numpy import *
from pylab import *
x=linspace(-5,5,30)
y=x**4
plot(x,y)
输出结果:
如果您要绘制特殊类型的线条,并想添加一些颜色,PyLab 提供了如下方法:
符号 | ‘-’,‘–’,‘-.’,‘:’,‘.’,‘,’,,o,^,v,<,>,s,+,x,D,d,1,2,3,4,h,H,p,| ,_ |
---|---|
颜色 | b(蓝色),g(绿色),r(红色),c(青色),m(品红),y(黄色),k(黑色),w(白色) |
使用示例如下:
from numpy import *
from pylab import *
x=linspace(-5,5,30)
y=x**4
plot(x,y,'g.')
输出结果:
如果您想在同一绘图区域内绘制多个图形,只需要使用多个绘图命令。示例如下:
from pylab import *
import numpy as np
import math
x=np.arange(0,math.pi*2,0.01)
plot(x,sin(x))
plot(x,cos(x),'g-.')
plot(x,-cos(x),'r--')
输出结果:
Matplotlib 提供了matplotlib.figure图形类模块,它包含了创建图形对象的方法。通过调用 pyplot 模块中 figure() 函数来实例化 figure 对象。如下所示:
from matplotlib import pyplot as plt
#创建图形对象
fig = plt.figure()
该函数的参数值,如下所示:
参数 | 说明 |
---|---|
figsize | 指定画布的大小,(宽度,高度),单位为英寸。 |
dpi | 指定绘图对象的分辨率,即每英寸多少个像素,默认值为80。 |
facecolor | 背景颜色。 |
dgecolor | 边框颜色。 |
frameon | 是否显示边框。 |
figure() 创建一个空白画布:
fig = plt.figure()
我们使用 add_axes() 将 axes 轴域添加到画布中。如下所示:
ax=fig.add_axes([0,0,1,1])
add_axes() 的参数值是一个序列,序列中的 4 个数字分别对应图形的左侧,底部,宽度,和高度,且每个数字必须介于 0 到 1 之间。
设置 x 和 y 轴的标签以及标题,如下所示:
调用 axes 对象的 plot() 方法,对 x 、 y 数组进行绘图操作:
ax.plot(x,y)
完整的代码如下所示:
import numpy as np
from matplotlib import pyplot as plt
import math
x=np.arange(-math.pi*4,math.pi*4,0.01)
y=sin(x)
fig=plt.figure()
ax=fig.add_axes([0,0,1,1])
ax.plot(x,y,'r-.')
ax.set_title("sin")
ax.set_xlabel('x')
ax.set_ylabel('y')
plt.show()
输出结果如下:
axes 类的 legend() 方法负责绘制画布中的图例,它需要三个参数,如下所示:
ax.legend(handles, labels, loc)
labels 是一个字符串序列,用来指定标签的名称;
loc 是指定图例位置的参数,其参数值可以用字符串或整数来表示;
handles 参数,它也是一个序列,它包含了所有线型的实例;
下面是 loc 参数的表示方法,分为字符串和整数两种,如下所示:
位置 | 字符串表示 | 整数数字表示 |
---|---|---|
自适应 | Best | 0 |
右上方 | upper right | 1 |
左上方 | upper left | 2 |
左下 | lower left | 3 |
右下 | lower right | 4 |
右侧 | right | 5 |
居中靠左 | center left | 6 |
居中靠右 | center right | 7 |
底部居中 | lower center | 8 |
上部居中 | upper center | 9 |
中部 | center | 10 |
这是 axes 类的基本方法,它将一个数组的值与另一个数组的值绘制成线或标记,plot() 方法具有可选格式的字符串参数,用来指定线型、标记颜色、样式以及大小。
颜色代码如下表:
‘b’ | 蓝色 |
---|---|
‘g’ | 绿色 |
‘r’ | 红色 |
‘c’ | 青色 |
‘m’ | 品红色 |
‘y’ | 黄色 |
‘k’ | 黑色 |
‘w’ | 白色 |
标记符号如下表:
标记符号 | 描述 |
---|---|
‘.’ | 点标记 |
‘o’ | 圆圈标记 |
‘x’ | 'X’标记 |
‘D’ | 钻石标记 |
‘H’ | 六角标记 |
‘s’ | 正方形标记 |
‘+’ | 加号标记 |
线型表示字符,如下表:
字符 | 描述 |
---|---|
‘-’ | 实线 |
‘–’ | 虚线 |
‘-.’ | 点划线 |
‘:’ | 虚线 |
‘H’ | 六角标记 |
下面的例子,以直线图的形式展示了电视、智能手机广告费与其所带来产品销量的关系图。其中描述电视的是带有黄色和方形标记的实线,而代表智能手机的则是绿色和圆形标记的虚线。
from matplotlib import pyplot as plt
import numpy as np
import math
x=np.arange(-math.pi*2,math.pi*2,0.001)
y=cos(x)
y1=sin(x)
fig=plt.figure()
ax=fig.add_axes([0.1,0.1,1.2,1.2])
ax.plot(x,y,'r-.')
ax.plot(x,y1,'g-.')
ax.legend(labels=('cos','sin'),loc='lower right')
ax.set_title("sin and cos")
ax.set_xlabel('x')
ax.set_ylabel('y')
plt.show()
输出结果如下:
matplotlib.pyplot模块提供了一个 subplot() 函数,它可以均等地划分画布,该函数的参数格式如下:
plt.subplot(nrows, ncols, index)
nrows 与 ncols 表示要划分几行几列的子区域(nrows*nclos表示子图数量),index 的初始值为1,用来选定具体的某个子区域。
例如: subplot(233)表示在当前画布的右上角创建一个两行三列的绘图区域(如下图所示),同时,选择在第 3 个位置绘制子图。
图1:示意图
如果新建的子图与现有的子图重叠,那么重叠部分的子图将会被自动删除,因为它们不可以共享绘图区域。
from matplotlib import pyplot as plt
plt.subplot(311)
plt.plot(facecolor='g')
plt.plot(range(20))
plt.subplot(312,facecolor='y')
plt.plot(range(10))
plt.subplot(313,facecolor='c')
plt.plot(range(15))
上述代码运行结果,如下图所示:
subplot绘制结果
如果不想覆盖之前的图,需要使用 add_subplot() 函数,代码如下:
import matplotlib.pyplot as plt
fig = plt.figure()
ax1 = fig.add_subplot(111,facecolor='w')
ax1.plot([1,2,3])
ax2 = fig.add_subplot(221, facecolor='y')
ax2.plot([1,2,3])
执行上述代码,输出结果如下:
add_subplot()绘图结果
通过给画布添加 axes 对象可以实现在同一画布中插入另外的图像。
from matplotlib import pyplot as plt import numpy as np import math x=np.arange(-math.pi*2,math.pi*2,0.01) y1=np.sin(x) y2=np.cos(x) fig=plt.figure() ax1=fig.add_axes([0,0,1,1]) ax2=fig.add_axes([0.8,0.8,0.9,0.9]) ax1.set_xlabel('x') ax2.set_xlabel('x') ax1.set_ylabel('sin(x)') ax2.set_ylabel('cos(x)') ax1.set_title("sin(x)") ax2.set_title("cos(x)") ax1.plot(x,y1,'r-.') ax2.plot(x,y2,'g-.') plt.show()
输出结果如下:
输出结果图
matplotlib.pyplot模块提供了一个 subplots() 函数,它的使用方法和 subplot() 函数类似。其不同之处在于,subplots() 既创建了一个包含子图区域的画布,又创建了一个 figure 图形对象,而 subplot() 只是创建一个包含子图区域的画布。
subplots 的函数格式如下:
fig , ax = plt.subplots(nrows, ncols)
nrows 与 ncols 表示两个整数参数,它们指定子图所占的行数、列数。
函数的返回值是一个元组,包括一个图形对象和所有的 axes 对象。其中 axes 对象的数量等于 nrows * ncols,且每个 axes 对象均可通过索引值访问(从1开始)。
下面我们创建了一个 2 行 2 列的子图,并在每个子图中显示 4 个不同的图像。
from matplotlib import pyplot as plt
import numpy as np
fig,a=plt.subplots(2,2)
x=np.arange(-10,10,0.01)
a[0][0].plot(x,x*x)
a[0][0].set_title('square')
a[0][1].plot(x,np.sqrt(x))
a[0][1].set_title('sqrt')
a[1][0].plot(x,exp(x))
a[1][0].set_title('exp(x)')
a[1][1].plot(x,log2(x))
a[1][1].set_title('log2(x)')
plt.show()
上述代码的输出结果如下:
matplotlib.pyplot 模块提供了 subplot2grid() ,该函数能够在画布的特定位置创建 axes 对象(即绘图区域)。不仅如此,它还可以使用不同数量的行、列来创建跨度不同的绘图区域。与 subplot() 和 subplots() 函数不同,subplot2gird() 函数以非等分的形式对画布进行切分,并按照绘图区域的大小来展示最终绘图结果。
函数语法格式如下:
plt.subplot2grid(shape, location, rowspan, colspan)
参数含义如下:
shape:把该参数值规定的网格区域作为绘图区域;
location:在给定的位置绘制图形,初始位置 (0,0) 表示第1行第1列;
rowsapan/colspan:这两个参数用来设置让子区跨越几行几列。
下面,在画布(figure)中添加了行、列跨度均不相同的绘图子区域,然后在每个绘图区上,绘制不同的图形。示例代码如下:
from matplotlib import pyplot as plt
import numpy as np
import math
a1=plt.subplot2grid((3,3),(0,0),colspan=2)
a2=plt.subplot2grid((3,3),(0,2),rowspan=3)
a3=plt.subplot2grid((3,3),(1,0),colspan=2,rowspan=2)
x=np.arange(-math.pi*2,math.pi*2,0.1)
a1.plot(x,np.sin(x),'r-.')
a2.plot(x,np.exp(x),'c-')
a3.plot(x,np.cos(x),'g-.')
plt.show()
输出结果如下:
subplot2grid()输出结果
grid() 的函数使用格式如下:
grid(color=‘b’, ls = ‘-.’, lw = 0.25)
参数含义如下:
color:表示网格线的颜色;
ls:表示网格线的样式;
lw:表示网格线的宽度;
网格在默认状态下是关闭的,通过调用上述函数,网格会被自动开启,如果您只是想开启不带任何样式的网格,可以通过 grid(True) 来实现。
from matplotlib import pyplot as plt import numpy as np import math fig,a=plt.subplots(1,3,figsize=(12,6)) x=np.arange(0,20,1) a[0].plot(x,x**3,'g-.',lw=2) a[0].grid(True) a[0].set_xlabel('x') a[0].set_ylabel('y') a[0].set_title("y=x**3") a[1].plot(x,np.exp(x),'r--',lw=2) a[1].grid(True) a[1].set_xlabel('x') a[1].set_ylabel('y') a[1].set_title("y=exp(x)") a[2].plot(x,np.log2(x),'c-',lw=2) a[2].grid(True) a[2].set_xlabel('x') a[2].set_ylabel('y') a[2].set_title("y=.log2(x)") fig.tight_layout() fig.show()
上述代码执行后,输出结果
:
图1:输出结果
在一个函数图像中,有时自变量 x 与因变量 y 是指数对应关系,这时需要将坐标轴刻度设置为对数刻度。Matplotlib 通过 axes 对象的xscale或yscale属性来实现对坐标轴的格式设置。
示例:右侧的子图显示对数刻度,左侧子图则显示标量刻度。
import matplotlib.pyplot as plt import numpy as np fig, axes = plt.subplots(1, 2, figsize=(10,4)) x = np.arange(1,5) axes[0].plot( x, np.exp(x)) axes[0].plot(x,x**2) axes[0].set_title("Normal scale") axes[1].plot (x, np.exp(x)) axes[1].plot(x, x**2) #设置y轴 axes[1].set_yscale("log") axes[1].set_title("Logarithmic scale (y)") axes[0].set_xlabel("x axis") axes[0].set_ylabel("y axis") axes[0].xaxis.labelpad = 10 #设置x、y轴标签 axes[1].set_xlabel("x axis") axes[1].set_ylabel("y axis") plt.show()
图1:对数关系图
轴是连接刻度的线,也就是绘图区域的边界,在绘图区域(axes 对象)的顶部、底部、左侧和右侧都有一个边界线(轴)。通过指定轴的颜色和宽度,从而对进行显示格式设置,比如将所有轴的颜色设置为 None,那么它们都会成为隐藏状态,或者也可以给轴添加相应的颜色。以下示例为左侧轴、底部轴分别设置了红色、蓝色,如下所示:
import matplotlib.pyplot as plt
fig = plt.figure()
ax = fig.add_axes([0,0,1,1])
#为左侧轴,底部轴添加颜色
ax.spines['bottom'].set_color('blue')
ax.spines['left'].set_color('red')
ax.spines['left'].set_linewidth(2)
#将侧轴、顶部轴设置为None
ax.spines['right'].set_color(None)
ax.spines['top'].set_color(None)
ax.plot([1,2,3,4,5])
plt.show()
输出结果如下:
Matplotlib 可以根据自变量与因变量的取值范围,自动设置 x 轴与 y 轴的数值大小。当然,您也可以用自定义的方式,通过 set_xlim() 和 set_ylim() 对 x、y 轴的数值范围进行设置。
当对 3D 图像进行设置的时,会增加一个 z 轴,此时使用 set_zlim() 可以对 z 轴进行设置。
下面示例分别对自动设置和自定义设置做了演示:第一种 Matplotlib 自动设置
import matplotlib.pyplot as plt
import numpy as np
fig = plt.figure()
#添加绘图区域
a1 = fig.add_axes([0,0,1,1])
#准备数据
x = np.arange(1,10)
#绘制函数图像
a1.plot(x, np.exp(x))
#添加题目
a1.set_title('exp')
plt.show()
代码执行后,输出结果如下:
图1:输出结果
第二种:自定义设置,set_xlim() 将 x 轴的数值范围设置为(0到10); set_ylim() 将 y 轴的范围设置为(0到10000)。
from matplotlib import pyplot as plt
import numpy as np
import math
x=np.arange(0,10)
y=np.exp(x)
plg=plt.figure()
a1=plg.add_axes([0,0,1,1])
a1.plot(x,y)
a1.set_xlim(0,15)
a1.set_ylim(0,10000)
输出结果如下:
刻度指的是轴上数据点的标记,Matplotlib 能够自动的在 x 、y 轴上绘制出刻度。这一功能的实现得益于 Matplotlib 内置的刻度定位器和格式化器(两个内建类)。在大多数情况下,这两个内建类完全能够满足我们的绘图需求,但是在某些情况下,刻度标签或刻度也需要满足特定的要求,比如将刻度设置为“英文数字形式”或者“大写阿拉伯数字”,此时就需要对它们重新设置。
xticks() 和 yticks() 函数接受一个列表对象作为参数,列表中的元素表示对应数轴上要显示的刻度。如下所示:
ax.set_xticks([2,4,6,8,10])
x 轴上的刻度标记,依次为 2,4,6,8,10。您也可以分别通过 set_xticklabels() 和 set_yticklabels() 函数设置与刻度线相对应的刻度标签。
下面示例对刻度和标签的使用方法做了说明。
```python
from matplotlib import pyplot as plt
import numpy as np
import math
x=np.arange(0,10)
y=np.exp(x)
plg=plt.figure()
a1=plg.add_axes([0,0,1,1])
a1.plot(x,y)
a1.set_xticklabels([i for i in range(11)])
a1.set_yticklabels([math.e**i for i in range(10)])
输出结果如下:
图1:绘制坐标轴刻度与标签
通过临时重写配置文件的方法,可以解决 Matplotlib 显示中文乱码的问题,代码如下所示:
import matplotlib.pyplot as plt plt.rcParams["font.sans-serif"]=["SimHei"] #设置字体 plt.rcParams["axes.unicode_minus"]=False #该语句解决图像中的“-”负号的乱码问题
将上述代码添加到您的绘图程序中,即可解决中文乱码的问题。这是一种非常灵活、便捷的解决方法。完整的程序代码如下:
import matplotlib.pyplot as plt
plt.rcParams["font.sans-serif"]=["SimHei"] #设置字体
plt.rcParams["axes.unicode_minus"]=False #该语句解决图像中的“-”负号的乱码问题
x=[2015,2016,2017,2018,2019,2020,2021,2022]
y=[8.1,7.2,8.2,7.3,6.4,7.3,7.4,2.9]
plt.plot(x,y)
plt.xlabel('年份')
plt.ylabel('增长率%')
plt.fill_between(x,y,5,color='yellow')
输出结果如下:
不过上述解决方案适用于所有操作系统,其唯一弊端是每编写一个绘图程序就要添加一次相同的代码。
下面介绍第二种方式:通过直接修改配置文件的方法,可以一劳永逸的解决 Matplotlib 的中文乱码问题。注意此过程在 Windows 环境下进行。
Matplotlib 从配置文件 matplotlibrc 中读取相关配置信息,比如字体、样式等,因此我们需要对该配置文件进行更改。首先查看 matplotlibrc 所在的目录,使用如下代码确定目录位置:
import matplotlib
matplotlib.matplotlib_fname()
然后修改配置文件 matplotlibrc。打开配置文件后,找到以下信息:
#font.family: sans-serif
#font.serif: DejaVu Serif, Bitstream Vera Serif, Computer Modern Roman, New Century Schoolbook, Century Schoolbook L, Utopia, ITC Bookman, Bookman, Nimbus Roman No9 L, Times New Roman, Times, Palatino, Charter, serif
将上述配置项前面的#去掉,并修改的配置项,如下所示:
font.family : Microsoft YaHei, sans-serif
font.serif: Microsoft YaHei, DejaVu Serif, Bitstream Vera Serif, Computer Modern Roman, New Century Schoolbook, Century Schoolbook L, Utopia, ITC Bookman, Bookman, Nimbus Roman No9 L, Times New Roman, Times, Palatino, Charter, serif
注意,由于版本问题,上述内容配置信息可能存在一些差异,请自动忽略。
最后,在以下目录中复制中文字体微软雅黑:
C:\Windows\Fonts\Microsoft YaHei UI
复制完成后,将字体粘贴至以下路径文件中:
返回路径中
字体粘贴后会出现一个 MSYH.ttc 的字体文件
在一些应用场景中,有时需要绘制两个 x 轴或两个 y 轴,这样可以更直观地显现图像,从而获取更有效的数据。Matplotlib 提供的 twinx() 和 twiny() 函数,除了可以实现绘制双轴的功能外,还可以使用不同的单位来绘制曲线,比如一个轴绘制对函数,另外一个轴绘制指数函数。
下面示例绘制了一个具有两个 y 轴的图形,一个显示指数函数 exp(x),另一个显示对数函数 log(x)。
import matplotlib.pyplot as plt
import numpy as np
fig = plt.figure()
a1 = fig.add_axes([0,0,1,1])
x = np.arange(10)
a1.plot(x,x**2)
a1.set_ylabel('x**2')
a2 = a1.twinx()
a2.plot(x, np.log(x),'ro-')
a2.set_ylabel('log')
fig.legend(labels = ('x**2','log'),loc='upper left')
plt.show()
输出结果:
柱状图是一种用矩形柱来表示数据分类的图表,柱状图可以垂直绘制,也可以水平绘制,它的高度与其所表示的数值成正比关系。柱状图显示了不同类别之间的比较关系,图表的水平轴 X 指定被比较的类别,垂直轴 Y 则表示具体的类别值。
Matplotlib 提供了bar()函数来绘制柱状图,它可以应用在 MATLAB 样式以及面向对象的绘图方法中。当它与 axes 对象一起使用时,其语法格式如下:
ax.bar(x, height, width, bottom, align)
该函数的参数说明,如下表所示:
bar()函数参数说明 | |
---|---|
x | 一个标量序列,代表柱状图的x坐标,默认x取值是每个柱状图所在的中点位置,或者也可以是柱状图左侧边缘位置。 |
height | 一个标量或者是标量序列,代表柱状图的高度。 |
width | 可选参数,标量或类数组,柱状图的默认宽度值为 0.8。 |
bottom | 可选参数,标量或类数组,柱状图的y坐标默认为None。 |
algin | 有两个可选项 {“center”,“edge”},默认为 ‘center’,该参数决定 x 值位于柱状图的位置。 |
该函数的返回值是一个 Matplotlib 容器对象,该对象包含了所有柱状图。
from matplotlib import pyplot as plt
fig=plt.figure()
a=fig.add_axes([0,0,1,1])
langs = ['C', 'C++', 'Java', 'Python', 'PHP']
students=[23,34,28,40,17]
a.bar(langs,students,width=0.9)
plt.show()
输出结果如下:
图1:matplotlib bar()绘图
通过调整柱状图的宽度,可以实现在同一 x 轴位置绘制多个柱状图。您可以将它们设置成不同的颜色,从而使它们更容易区分。下面示例描述了某工程学院过去四年中,三个专业录取的统招学生数量。
import numpy as np
import matplotlib.pyplot as plt
#准备数据
data =[[30, 25, 50, 20],[40, 23, 51, 17],[35, 22, 45, 19]]
X = np.arange(4)
fig = plt.figure()
#添加子图区域
ax = fig.add_axes(\[0,0,1,1\])
#绘制柱状图
ax.bar(X + 0.00, data[0], color = 'b', width = 0.25)
ax.bar(X + 0.25, data[1], color = 'g', width = 0.25)
ax.bar(X + 0.50, data[2], color = 'r', width = 0.25)
上述代码执行后,将显示四个柱状图,将每个柱状图又均分为三个小柱状图,每个柱状图占据 0.25 个单位。
图2:matplotlib绘图
柱状图除了上述使用方法外,还有另外一种堆叠柱状图。所谓堆叠柱状图就是将不同数组别的柱状图堆叠在一起,堆叠后的柱状图高度显示了两者相加的结果值。
bar() 函数提供了一个可选参数bottom,该参数可以指定柱状图开始堆叠的起始值,一般从底部柱状图的最大值开始,依次类推。
下面是一个不同国家参加奥林匹克运动会所得奖牌(金银铜)的柱状堆叠图示例,如下所示:
import numpy as np import matplotlib.pyplot as plt countries = ['USA', 'India', 'China', 'Russia', 'Germany'] bronzes = np.array([38, 17, 26, 19, 15]) silvers = np.array([37, 23, 18, 18, 10]) golds = np.array([46, 27, 26, 19, 17]) ind = [x for x, _ in enumerate(countries)] #绘制堆叠图 plt.bar(ind, golds, width=0.5, label='golds', color='gold', bottom=silvers+bronzes) plt.bar(ind, silvers, width=0.5, label='silvers', color='silver', bottom=bronzes) plt.bar(ind, bronzes, width=0.5, label='bronzes', color='#CD853F') #设置坐标轴 plt.xticks(ind, countries) plt.ylabel("Medals") plt.xlabel("Countries") plt.legend(loc="upper right") plt.title("2022 Top Scorers") plt.show()
在上述代码中,第一次调用plt.bar()绘制了黄色柱状图, 第二次调用plot.bar()时绘制了灰色柱状图,最后一次调用plt.bar()则绘制最底部的柱状图。两个柱状图相接触的位置就是顶部与底部的位置,这样就构成了柱状堆叠图。
直方图(Histogram),又称质量分布图,它是一种条形图的一种,由一系列高度不等的纵向线段来表示数据分布的情况。 直方图的横轴表示数据类型,纵轴表示分布情况。
首先,我们需要了解柱状图和直方图的区别。直方图用于概率分布,它显示了一组数值序列在给定的数值范围内出现的概率;而柱状图则用于展示各个类别的频数。
例如,我们对某工厂的员工年龄做直方图统计,首先我们要统计出每一位员工的年龄,然后设定一个 20 至 65 的数值范围,并将该数值范围细分为 4 个区间段 (20,35),(35,45),(45,55),(55,65) , 最后通过直方图的形式,展示该工厂员工在相应年龄区间的分布情况。
如果想要构建直方图,必须遵循以下步骤:
将整个值范围划分为一系列区间。
区间值(bin)的取值,不可遗漏数据;
计算每个区间中有多少个值。
通常将 bin 指定为连续且不重叠的数值区间,而 bin 值指区间开始和结束的数值。
您可以使用下面的函数来绘制直方图:
matplotlib.pyplot.hist()
该函数的参数说明如下:
x | 必填参数,数组或者数组序列。 |
---|---|
bins | 可选参数,整数或者序列,bins 表示每一个间隔的边缘(起点和终点)默认会生成10个间隔。 |
range | 指定全局间隔的下限与上限值 (min,max),元组类型,默认值为 None。 |
density | 如果为 True,返回概率密度直方图;默认为 False,返回相应区间元素的个数的直方图。 |
histtype | 要绘制的直方图类型,默认值为“bar”,可选值有 barstacked(堆叠条形图)、step(未填充的阶梯图)、stepfilled(已填充的阶梯图)。 |
以下示例绘制了班级学生得分情况的直方图。其中定义了四个区间(bins)分别是:0-25、26-50、51-75 和 76-100。直方图显示了相应范围的学生人数。
from matplotlib import pyplot as plt
import numpy
fig,a=plt.subplots(1,1)
data=[21,34,56,87,99,11,23,45,76,12,35,12,46,86,56,77,9,57,79]
a.hist(data)
a.set_xticks([10,20,30,40,50,60,70,80,90,100])
上述代码执行后,输出结果如下:
图1:直方图绘制结果
饼状图用来显示一个数据系列,具体来说,饼状图显示一个数据系列中各项目的占项目总和的百分比。
Matplotlib 提供了一个 pie() 函数,该函数可以生成数组中数据的饼状图。您可使用 x/sum(x) 来计算各个扇形区域占饼图总和的百分比。pie() 函数的参数说明如下:
[TABLE]
以下示例:关于不同计算机语言学习人数的饼状图。autopct 参数设置为 %1.2f% ,并将各项所占总和的百分比显示在相对应的扇形区内。
from matplotlib import pyplot as plt
import numpy as np
flg=plt.figure()
a=flg.add_axes([0,0,1,1])
a.axis('equal')
subject=['c','c++','java','python','maltab']
students=[12,16,23,25,14]
a.pie(students, labels = langs,autopct='%1.3f%%')
plt.show()
图1:Matplotlib饼状图
折线图(line chart)是我们日常工作、学习中经常使用的一种图表,它可以直观的反映数据的变化趋势。与绘制柱状图、饼状图等图形不同,Matplotlib 并没有直接提供绘制折线图的函数,因此本节着重讲解如何绘制一幅折线图。
下面示例是关于 C语言中文网用户活跃度的折线图:
from matplotlib import pyplot as plt
x = ["Mon", "Tues", "Wed", "Thur", "Fri","Sat","Sun"]
y = [20, 40, 35, 55, 42, 80, 50]
plt.plot(x,y,"g",markersize=4,label="周活跃")
plt.xlabel("登陆时间")
plt.ylabel("周活跃度")
plt.legend(loc="lower right")
plt.title("博客")
for x1, y1 in zip(x, y):
plt.text(x1, y1, str(y1), ha='center', va='bottom', fontsize=10)
plt.savefig("1.jpg")
plt.show()
当学习完如何绘制单条折线的绘制后,再绘制多条折线也变的容易,只要准备好绘制多条折线图的数据即可。
下面是一个简单示例,绘制了两天内同一时刻,天气温度随时间变化的折线图:
from matplotlib import pyplot as plt x = [5, 8, 12, 14, 16, 18, 20] y1 = [18, 21, 29, 31, 26, 24, 20] y2 = [15, 18, 24, 30, 31, 25, 24] plt.plot(x,y1,'y',marker="*",markersize=8) plt.plot(x,y2,'g',marker="*",markersize=8) #* 表示绘制五角星;此处也可以不设置线条颜色,matplotlib会自动为线条添加不同的颜色 plt.title("temperture's map") for a,b in zip(x,y1): plt.text(a,b,str(b),ha='center',va='bottom',fontsize=8) for a,b in zip(x,y2): plt.text(a,b,str(b),ha='center',va='bottom',fontsize=10) plt.xlabel("time") plt.ylabel("temperture") plt.legend(['today','nextday'],loc='lower right') plt.show()
散点图用于在水平轴和垂直轴上绘制数据点,它表示了因变量随自变量变化的趋势。通俗地讲,它反映的是一个变量受另一个变量的影响程度。
散点图将序列显示为一组点,其中每个散点值都由该点在图表中的坐标位置表示。对于不同类别的点,则由图表中不同形状或颜色的标记符表示。同时,您也可以设置标记符的颜色或大小。
下面示例,绘制了学生考试成绩的散点图,其中蓝色代表男孩成绩,红色表示女孩的成绩。
from matplotlib import pyplot as plt
girls_grades = [89, 90, 70, 89, 100, 80, 90, 100, 80, 34]
boys_grades = [30, 29, 49, 48, 100, 48, 38, 45, 20, 30]
grades_range = [10, 20, 30, 40, 50, 60, 70, 80, 90, 100]
fig=plt.figure()
ax=fig.add_axes([0,0,1,1])
ax.scatter(grades_range,girls_grades,color='b',label='girl')
ax.scatter(grades_range,boys_grades,color='g',label='boy')
ax.set_xlabel('graderange')
ax.set_ylabel('score')
ax.set_title('graderangescore')
plt.legend(['girl','boy'],loc='lower right')
plt.show()
代码执行后,输出结果如下:
等高线图(也称“水平图”)是一种在二维平面上显示 3D 图像的方法。等高线有时也被称为 “Z 切片”,如果您想要查看因变量 Z 与自变量 X、Y 之间的函数图像变化(即 Z=f(X,Y)),那么采用等高线图最为直观。
自变量 X 和 Y 需要被限制在矩形网格内,您可以将 x 、y 数组作为参数传递给 numpy.meshgrid() 函数来构建一个网格点矩阵。
关于 meshgrid() 函数用法可参考《numpy.meshgrid()用法详解》。
Matplotlib API 提供了绘制等高线(contour)与填充等高线( contourf)的函数。这两个函数都需要三个参数,分别是 X、Y 与 Z。
from matplotlib import pyplot as plt
import numpy as np
xlist = np.linspace(-3.0, 3.0, 10)
ylist=np.linspace(-3.0,3.0,100)
X, Y = np.meshgrid(xlist, ylist)
Z=np.sqrt(X**2+Y**2)
fig,ax=plt.subplots(1,1)
cp = ax.contourf(X,Y,Z)#填充等高线颜色
fig.colorbar(cp)
plt.contour(X,Y,Z,colors=('y'))#画等高线
ax.set_title('Filled Contours Plot')
ax.set_xlabel('x (cm)')
ax.set_ylabel('y (cm)')
plt.show()
图1:等高线示例图
左侧图像绘制了两个变量 X、Y ,右侧的颜色柱(colorbar)则表示 X 的取值,颜色越深表示值越小,中间深色部分的圆心点表示 x=0,y=0,z=0。
箱型图(也称为盒须图)于 1977 年由美国著名统计学家约翰·图基(John Tukey)发明。它能显示出一组数据的最大值、最小值、中位数、及上下四分位数。
在箱型图中,我们从上四分位数到下四分位数绘制一个盒子,然后用一条垂直触须(形象地称为“盒须”)穿过盒子的中间。上垂线延伸至上边缘(最大值),下垂线延伸至下边缘(最小值)。箱型图结构如下所示:
首先准备创建箱型图所需数据:您可以使用numpy.random.normal()函数来创建一组基于正态分布的随机数据,该函数有三个参数,分别是正态分布的平均值、标准差以及期望值的数量。如下所示:
collectn_1 = np.random.normal(500, 250, 100)
collectn_2 = np.random.normal(800, 180, 200)
collectn_3 = np.random.normal(900, 150, 300)
collectn_4 = np.random.normal(700, 100, 200)
然后用 data_to_plot 变量指定创建箱型图所需的数据序列,最后用 boxplot() 函数绘制箱型图,完整代码如下所示:
import numpy as np
from matplotlib import pyplot as plt
collectn_1 = np.random.normal(500, 250, 100)
collectn_2 = np.random.normal(800, 180, 200)
collectn_3 = np.random.normal(900, 150, 300)
collectn_4 = np.random.normal(700, 100, 200)
data=[collectn_1,collectn_2,collectn_3,collectn_4]
fig=plt.figure()
ax=fig.add_axes([0,0,1,1])
ax.boxplot(data)
plt.show()
上述代码执行后,输出结果如下:
最初开发的 Matplotlib,仅支持绘制 2d 图形,后来随着版本的不断更新, Matplotlib 在二维绘图的基础上,构建了一部分较为实用的 3D 绘图程序包,比如 mpl_toolkits.mplot3d,通过调用该程序包一些接口可以绘制 3D散点图、3D曲面图、3D线框图等
mpl_toolkits 是 Matplotlib 的绘图工具包。
下面编写第一个三维绘图程序。
首先创建一个三维绘图区域, plt.axes() 函数提供了一个参数projection,将其参数值设置为 “3d”。如下所示:
#导入三维工具包mplot3d
from mpl_toolkits import mplot3d
import numpy as np
import matplotlib.pyplot as plt
fig = plt.figure()
#创建3d绘图区域
ax = plt.axes(projection='3d')
有了三维绘图区域,接下来就要构建 3d 图像,如下所示:
#从三个维度构建
import numpy as np
z=np.linspace(0,1,100)
x=10*np.cos(z*100)
y=10*np.sin(z*100)
最后调用 plot3D() 方法绘制 3d 图形,代码如下:
ax.plot3D(x,y,z,'gray')
ax.set_title("3D Line")
完整程序如下所示:
from matplotlib import pyplot as plt
from mpl_toolkits import mplot3d
import numpy as np
z=np.linspace(0,1,100)
x=10*np.cos(z*100)
y=10*np.sin(z*100)
fig=plt.figure()
ax=plt.axes(projection='3d')
ax.plot3D(x,y,z,'gray')
ax.set_title("3D Line")
plt.show()
输出结果如下所示:
上述代码中的 ax.plot3D() 函数可以绘制各种三维图形,这些三维图都要根据(x,y,z)三元组类来创建。
通过 ax.scatter3D() 函数可以绘制 3D 散点图,示例代码如下:
from matplotlib import pyplot as plt
import mpl_toolkits.mplot3d
import numpy as np
z=np.linspace(-1,1,1000)
x=10*np.cos(z*100)
y=10*np.sin(z*100)
fig=plt.figure()
ax=plt.axes(projection='3d')
ax.scatter3D(x,y,z)
ax.set_title("Scatter 3D Line")
plt.show()
输出结果图:
ax.contour3D() 可以用来创建三维等高线图,该函数要求输入数据均采用二维网格式的矩阵坐标。同时,它可以在每个网格点(x,y)处计算出一个 z 值。
以下示例展示了如何绘制三维正弦等高线图。代码如下:
def f(x, y): return np.sin(np.sqrt(x ** 2 + y ** 2)) from matplotlib import pyplot as plt import mpl_toolkits.mplot3d import numpy as np x = np.linspace(-1, 1, 100) y = np.linspace(-1, 1, 100) #将数据网格化处理 X, Y = np.meshgrid(x, y) Z = f(X, Y) fig=plt.figure() ax=plt.axes(projection='3d') ax.contour3D(X,Y,Z,50, cmap='binary') ax.set_title("Scatter 3D Line") ax.set_xlabel('x') ax.set_ylabel('y') ax.set_zlabel('z') plt.show()
输出结果图如下:
线框图同样要采用二维网格形式的数据,与绘制等高线图类似。
线框图可以将数据投影到指定的三维表面上,并输出可视化程度较高的三维效果图。通过 plot_wireframe() 能够绘制 3D 线框图。
代码如下:
def f(x, y): return np.sin(np.sqrt(x ** 2 + y ** 2)) from matplotlib import pyplot as plt import mpl_toolkits.mplot3d import numpy as np x = np.linspace(-3, 3, 100) y = np.linspace(-3, 3, 100) #将数据网格化处理 X, Y = np.meshgrid(x, y) Z = f(X, Y) fig=plt.figure() ax=plt.axes(projection='3d') #调用绘制线框图的函数plot_wireframe() ax.plot_wireframe(X, Y, Z, color='g') ax.set_title("wireframe 3D Line") ax.set_xlabel('x') ax.set_ylabel('y') ax.set_zlabel('z') plt.show()
输出结果如下:
曲面图表示一个指定的因变量y与两个自变量x和z之间的函数关系。
3D 曲面图是一个三维图形,它非常类似于线框图。不同之处在于,线框图的每个面都由多边形填充而成。Matplotlib 提供的 plot_surface() 函数可以绘制 3D 曲面图,该函数需要接受三个参数值 x,y 和 z 。示例代码如下:
from mpl_toolkits import mplot3d
import numpy as np
import matplotlib.pyplot as plt
#求向量积(outer()方法又称外积)
x = np.outer(np.linspace(-2.5, 2.5, 100), np.ones(100))
y = x.copy().T
#数据z
z = np.cos(x ** 2 + y ** 2)
#绘制曲面图
fig = plt.figure()
ax = plt.axes(projection='3d')
#调用plot_surface()函数
ax.plot_surface(x, y, z,cmap='viridis', edgecolor='none')
ax.set_title('Surface plot')
plt.show()
输出结果图:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。