当前位置:   article > 正文

十二个常用的 matplotlib 绘图案例_matplotlib经典案例

matplotlib经典案例

数据分析和机器学习中,matplotlib 是一个常用的Python绘图库,用于创建各种类型的图表和可视化。本文总结了12种常用的图形。

折线图

折线图(Line Plot):用于显示数据随时间或其他连续变量的变化趋势。在实际项目中,可以用于可视化模型性能随着训练迭代次数的变化。
下面示例中,我们将绘制一个包含多个数据系列的折线图。

看代码,创建一个包含多个数据系列的折线图:

  1. import matplotlib.pyplot as plt
  2. import numpy as np
  3. # 创建示例数据集
  4. x = np.linspace(0, 10, 100) # 生成010之间的100个数据点作为x轴
  5. y1 = np.sin(x) # 第一个数据系列,正弦函数
  6. y2 = np.cos(x) # 第二个数据系列,余弦函数
  7. y3 = np.sin(2 * x) # 第三个数据系列,正弦函数的倍频
  8. # 创建一个Matplotlib图表
  9. plt.figure(figsize=(10, 6)) # 设置图表的大小
  10. # 绘制折线图
  11. plt.plot(x, y1, label='sin(x)', color='blue', linestyle='-', linewidth=2)
  12. plt.plot(x, y2, label='cos(x)', color='red', linestyle='--', linewidth=2)
  13. plt.plot(x, y3, label='sin(2x)', color='green', linestyle='-.', linewidth=2)
  14. # 添加标题和标签
  15. plt.title('Complex Line Plot')
  16. plt.xlabel('X-axis')
  17. plt.ylabel('Y-axis')
  18. # 添加图例
  19. plt.legend()
  20. # 自定义坐标轴范围
  21. plt.xlim(0, 10)
  22. plt.ylim(-2, 2)
  23. # 添加网格线
  24. plt.grid(True, linestyle='--', alpha=0.6)
  25. # 保存图像(可选)
  26. # plt.savefig('complex_line_plot.png')
  27. # 显示图像
  28. plt.show()

包含三个不同的数据系列,每个系列都具有不同的线型和颜色。
可以根据需要自定义图表的样式、颜色和标签。

散点图

散点图(Scatter Plot):用于显示两个变量之间的关系,通常用于观察数据的分布、异常值或类别之间的关系。
创建一个包含多个数据系列的散点图。

我们将使用随机生成的数据集来模拟复杂的散点图:

  1. import matplotlib.pyplot as plt
  2. import numpy as np
  3. # 创建示例数据集
  4. np.random.seed(0)
  5. n_points = 200
  6. x = np.random.rand(n_points) # 随机生成x坐标
  7. y1 = np.random.rand(n_points) # 随机生成y坐标
  8. y2 = 1.5 * x + np.random.rand(n_points) # 生成带趋势的数据
  9. colors = np.random.rand(n_points) # 随机生成颜色值
  10. sizes = np.random.rand(n_points) * 100 # 随机生成点的大小
  11. # 创建一个Matplotlib图表
  12. plt.figure(figsize=(10, 6)) # 设置图表的大小
  13. # 绘制散点图
  14. plt.scatter(x, y1, label='Random Data', c=colors, s=sizes, alpha=0.7, cmap='viridis')
  15. plt.scatter(x, y2, label='Trendline Data', c='red', marker='x', s=50, alpha=0.7)
  16. # 添加标题和标签
  17. plt.title('Complex Scatter Plot')
  18. plt.xlabel('X-axis')
  19. plt.ylabel('Y-axis')
  20. # 添加图例
  21. plt.legend()
  22. # 自定义坐标轴范围
  23. plt.xlim(0, 1)
  24. plt.ylim(0, 2)
  25. # 添加颜色条
  26. # colorbar = plt.colorbar()
  27. # colorbar.set_label('Color Intensity')
  28. # 保存图像(可选)
  29. # plt.savefig('complex_scatter_plot.png')
  30. # 显示图像
  31. plt.show()

上面代码创建了一个复杂的散点图,其中包含两个不同的数据系列,每个系列都具有不同的颜色、标记和点大小。通过使用cmap参数,可以改变数据点的颜色映射。
可以根据需要自定义图表的样式、颜色和标签。

直方图

直方图(Histogram):用于显示数据的分布情况,特别适用于展示数值型数据的频率分布。
使用多个数据系列以及自定义的颜色、透明度和边界线等属性来创建一个直方图。

  1. import matplotlib.pyplot as plt
  2. import numpy as np
  3. # 创建示例数据集(多个数据系列)
  4. np.random.seed(0)
  5. data_series = [np.random.normal(0, std, 1000) for std in range(1, 4)]
  6. # 创建一个Matplotlib图表
  7. plt.figure(figsize=(10, 6)) # 设置图表的大小
  8. # 绘制直方图
  9. plt.hist(data_series, bins=20, color=['blue', 'green', 'purple'], alpha=0.7, label=['Series 1', 'Series 2', 'Series 3'], edgecolor='black')
  10. # 添加标题和标签
  11. plt.title('Complex Histogram')
  12. plt.xlabel('Value')
  13. plt.ylabel('Frequency')
  14. # 添加图例
  15. plt.legend()
  16. # 自定义坐标轴范围
  17. plt.xlim(-4, 4)
  18. plt.ylim(0, 300)
  19. # 添加网格线
  20. plt.grid(True, linestyle='--', alpha=0.6)
  21. # 保存图像(可选)
  22. # plt.savefig('complex_histogram.png')
  23. # 显示图像
  24. plt.show()

代码中,包含三个不同的数据系列,每个系列都具有不同的颜色、透明度和边界线颜色。直方图的bins数设置为20,可以根据需要进行调整。
可以根据实际情况自定义样式、颜色和标签。

柱状图

柱状图(Bar Plot):用于比较不同类别之间的数据,例如不同产品的销售量或不同类别的统计数据。
当涉及到柱状图可视化时,Matplotlib提供了丰富的自定义选项。
下面代码将创建一个具有多个数据系列、堆叠柱状图和自定义颜色、标签等属性的柱状图。

  1. import matplotlib.pyplot as plt
  2. import numpy as np
  3. # 创建示例数据集(多个数据系列)
  4. categories = ['Category A', 'Category B', 'Category C', 'Category D']
  5. data_series1 = [3, 4, 2, 6]
  6. data_series2 = [2, 5, 1, 4]
  7. data_series3 = [1, 3, 4, 2]
  8. # 创建一个Matplotlib图表
  9. plt.figure(figsize=(10, 6)) # 设置图表的大小
  10. # 绘制柱状图(堆叠)
  11. bar_width = 0.2
  12. index = np.arange(len(categories))
  13. plt.bar(index, data_series1, bar_width, label='Series 1', color='blue', edgecolor='black')
  14. plt.bar(index, data_series2, bar_width, label='Series 2', color='green', edgecolor='black', bottom=data_series1)
  15. plt.bar(index, data_series3, bar_width, label='Series 3', color='purple', edgecolor='black', bottom=np.array(data_series1) + np.array(data_series2))
  16. # 添加标题和标签
  17. plt.title('Complex Bar Chart')
  18. plt.xlabel('Categories')
  19. plt.ylabel('Values')
  20. # 添加图例
  21. plt.legend()
  22. # 自定义坐标轴标签
  23. plt.xticks(index, categories)
  24. # 自定义坐标轴范围
  25. plt.ylim(0, 15)
  26. # 添加网格线
  27. plt.grid(True, linestyle='--', alpha=0.6)
  28. # 保存图像(可选)
  29. # plt.savefig('complex_bar_chart.png')
  30. # 显示图像
  31. plt.show()

示例中,使用了三个数据系列,每个系列都具有不同的颜色。柱状图被堆叠在一起,以显示每个类别中各系列的值,并使用bottom参数来堆叠。

箱线图

箱线图(Box Plot):用于展示数据的分布、中位数、离群值等统计信息,有助于检测数据中的异常值。
导入必要的库和生成一个示例数据集:

  1. import matplotlib.pyplot as plt
  2. import numpy as np
  3. # 创建一个示例数据集,这里使用随机生成的数据
  4. np.random.seed(0)
  5. data = [np.random.normal(0, std, 100) for std in range(1, 4)]
  6. # 设置箱线图的标签
  7. labels = ['Dataset 1', 'Dataset 2', 'Dataset 3']
  8. # 创建一个箱线图
  9. fig, ax = plt.subplots(figsize=(10, 6))
  10. # 自定义箱线图的外观,包括颜色、填充、标记和线宽
  11. boxprops = dict(linewidth=2, color='blue', facecolor='lightblue')
  12. flierprops = dict(marker='o', markerfacecolor='red', markersize=8, linestyle='none')
  13. medianprops = dict(linestyle='-', linewidth=2, color='green')
  14. whiskerprops = dict(color='blue', linewidth=2)
  15. capprops = dict(color='blue', linewidth=2)
  16. # 画出箱线图
  17. bplot = ax.boxplot(data, vert=True, patch_artist=True, labels=labels,
  18. boxprops=boxprops, flierprops=flierprops,
  19. medianprops=medianprops, whiskerprops=whiskerprops,
  20. capprops=capprops)
  21. # 自定义Y轴标签
  22. ax.set_ylabel('Values')
  23. # 添加标题
  24. ax.set_title('Complex Box Plot')
  25. # 添加网格线
  26. ax.yaxis.grid(True, linestyle='--', which='major', color='gray', alpha=0.7)
  27. # 自定义箱线图的背景色
  28. colors = ['lightblue', 'lightgreen', 'lightpink']
  29. for patch, color in zip(bplot['boxes'], colors):
  30. patch.set_facecolor(color)
  31. # 自定义X轴刻度标签
  32. ax.set_xticklabels(labels)
  33. # 显示图例
  34. legend_elements = [plt.Line2D([0], [0], marker='o', color='w', markerfacecolor='red', markersize=10, label='Outliers')]
  35. ax.legend(handles=legend_elements, loc='upper right')
  36. # 自定义X轴标签位置
  37. ax.set_xticks(np.arange(1, len(labels) + 1))
  38. # 调整Y轴刻度范围,根据的数据集进行调整
  39. ax.set_ylim(-5, 10)
  40. # 显示图形
  41. plt.tight_layout()
  42. plt.show()

上面代码创建不同颜色的箱体、自定义标记的异常值、自定义线条属性和其他个性化选项。

热力图

热力图(Heatmap):用于可视化矩阵数据,通常用于显示相关性、相似性矩阵或特征之间的关系。
下面创建一个热力图,并提供多个定制化参数:

  1. import matplotlib.pyplot as plt
  2. import numpy as np
  3. # 创建示例数据集(这里使用随机生成的数据)
  4. np.random.seed(0)
  5. data = np.random.rand(10, 10)
  6. # 设置热力图的标签和自定义参数
  7. labels = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J']
  8. cmap = 'YlOrRd' # 自定义颜色映射
  9. annot = True # 显示数值标签
  10. fmt = '.2f' # 数值标签格式
  11. # 创建热力图
  12. fig, ax = plt.subplots(figsize=(8, 8))
  13. # 自定义热力图的外观
  14. heatmap = ax.imshow(data, cmap=cmap, aspect='auto')
  15. # 显示数值标签
  16. if annot:
  17. for i in range(len(labels)):
  18. for j in range(len(labels)):
  19. text = ax.text(j, i, format(data[i, j], fmt),
  20. ha="center", va="center", color="black")
  21. # 添加颜色条
  22. cbar = plt.colorbar(heatmap)
  23. # 自定义X轴和Y轴标签
  24. ax.set_xticks(np.arange(len(labels)))
  25. ax.set_yticks(np.arange(len(labels)))
  26. ax.set_xticklabels(labels)
  27. ax.set_yticklabels(labels)
  28. # 添加标题
  29. ax.set_title('Customized Heatmap')
  30. # 自定义热力图的颜色条标签
  31. cbar.set_label('Values', rotation=270, labelpad=15)
  32. # 显示图形
  33. plt.tight_layout()
  34. plt.show()

上面代码中提供了多个定制化参数,包括颜色映射、数值标签、数值标签格式、颜色条标签等。可以根据自己的数据集和需求进一步自定义热力图,例如更改颜色映射、调整数值标签格式、添加自定义标题等。

饼图

饼图(Pie Chart):用于显示数据的部分与整体的比例,通常用于显示类别的占比。
一个出色的饼图,并提供多个定制化参数,使用随机数据集进行案例的展示:

  1. import matplotlib.pyplot as plt
  2. # 创建示例数据集(这里使用随机生成的数据)
  3. labels = ['Category A', 'Category B', 'Category C', 'Category D']
  4. sizes = [15, 30, 45, 10] # 自定义每个类别的大小
  5. explode = (0.1, 0, 0, 0) # 自定义饼图中的分离
  6. # 自定义颜色,可以使用Matplotlib中的其他颜色映射
  7. colors = ['#ff9999', '#66b3ff', '#99ff99', '#c2c2f0']
  8. # 自定义百分比格式
  9. autopct = '%1.1f%%'
  10. # 创建饼图
  11. fig, ax = plt.subplots()
  12. # 自定义饼图的外观
  13. ax.pie(sizes, explode=explode, labels=labels, colors=colors, autopct=autopct,
  14. shadow=True, startangle=90, wedgeprops={'edgecolor': 'gray'})
  15. # 添加标题
  16. ax.set_title('Customized Pie Chart')
  17. # 显示图形
  18. plt.tight_layout()
  19. plt.show()

上面创建的饼图中,提供了多个定制化参数,包括每个类别的大小、分离、颜色、百分比格式等。可以根据自己的数据集和需求进一步自定义饼图,例如更改颜色、调整百分比格式、添加自定义标题等。

面积图

面积图(Area Plot):类似于折线图,但可以用于展示多个类别之间的堆积关系,通常用于时间序列数据。
创建一个面积堆积图时,需要考虑多个定制化参数以确保可视化效果出色。

  1. import matplotlib.pyplot as plt
  2. import numpy as np
  3. # 创建示例数据集
  4. years = [2010, 2011, 2012, 2013, 2014]
  5. categories = ['Category A', 'Category B', 'Category C', 'Category D']
  6. data = np.array([
  7. [5, 8, 6, 9, 12],
  8. [7, 10, 8, 11, 14],
  9. [4, 6, 5, 7, 9],
  10. [3, 5, 4, 6, 7]
  11. ])
  12. # 自定义堆积颜色
  13. colors = ['#ff9999', '#66b3ff', '#99ff99', '#c2c2f0']
  14. # 创建面积堆积图
  15. fig, ax = plt.subplots(figsize=(10, 6))
  16. # 绘制面积堆积图
  17. bottoms = np.zeros(len(years))
  18. for i, category in enumerate(categories):
  19. ax.fill_between(years, bottoms, bottoms + data[i], label=category, color=colors[i], alpha=0.7)
  20. bottoms += data[i]
  21. # 添加标题
  22. ax.set_title('Customized Stacked Area Chart (Complex Data)')
  23. # 自定义X轴和Y轴标签
  24. ax.set_xlabel('Year')
  25. ax.set_ylabel('Values')
  26. # 添加图例
  27. ax.legend(loc='upper left')
  28. # 添加阴影
  29. ax.grid(alpha=0.3)
  30. # 自定义Y轴刻度
  31. ax.set_yticks(np.arange(0, max(bottoms), step=10))
  32. # 自定义X轴刻度标签
  33. ax.set_xticks(years)
  34. # 显示图形
  35. plt.tight_layout()
  36. plt.show()

包括数据集、自定义颜色、图例、标签、标题、阴影、刻度标签等。

等高线图

等高线图(Contour Plot):用于可视化二维数据的等高线,通常用于显示函数的等值线。
下面案例包含自定义的数据集和多个定制化参数:

  1. import matplotlib.pyplot as plt
  2. import numpy as np
  3. # 创建示例数据集
  4. x = np.linspace(-2, 2, 400)
  5. y = np.linspace(-2, 2, 400)
  6. X, Y = np.meshgrid(x, y)
  7. Z = np.sin(np.sqrt(X**2 + Y**2)) * np.exp(-0.2 * np.sqrt(X**2 + Y**2))
  8. # 自定义等高线参数
  9. levels = np.linspace(-1, 1, 20)
  10. cmap = plt.get_cmap('RdYlBu_r') # 自定义颜色映射
  11. # 创建等高线图
  12. fig, ax = plt.subplots(figsize=(8, 8))
  13. # 绘制等高线图
  14. contour = ax.contourf(X, Y, Z, levels=levels, cmap=cmap)
  15. # 添加等高线线条
  16. contour_lines = ax.contour(X, Y, Z, levels=levels, colors='k', linewidths=0.5)
  17. # 添加颜色条
  18. cbar = plt.colorbar(contour, ax=ax, ticks=np.arange(-1, 1.2, 0.2))
  19. cbar.set_label('Values')
  20. # 添加标题
  21. ax.set_title('Customized Contour Plot')
  22. # 自定义X轴和Y轴标签
  23. ax.set_xlabel('X-axis')
  24. ax.set_ylabel('Y-axis')
  25. # 添加网格线
  26. ax.grid(linestyle='--', alpha=0.7)
  27. # 添加等高线标签
  28. ax.clabel(contour_lines, inline=1, fontsize=8, fmt='%0.1f')
  29. # 显示图形
  30. plt.tight_layout()
  31. plt.show()

创建了一个等高线图,包括自定义等高线参数、颜色映射、颜色条、等高线线条、标签、标题、网格线等。
可以根据实际情况自定义等高线图,例如更改颜色、调整标签、添加自定义标题等。

3D图

3D图(3D Plot):用于可视化包含三个变量的数据,例如三维散点图、三维曲面图等。
同样是使用了自定义的数据集和多个定制化参数:

  1. import matplotlib.pyplot as plt
  2. from mpl_toolkits.mplot3d import Axes3D
  3. import numpy as np
  4. # 创建示例数据集
  5. x = np.linspace(-5, 5, 100)
  6. y = np.linspace(-5, 5, 100)
  7. X, Y = np.meshgrid(x, y)
  8. Z = np.sin(np.sqrt(X**2 + Y**2)) / (np.sqrt(X**2 + Y**2) + 1)
  9. # 创建3D图形
  10. fig = plt.figure(figsize=(10, 8))
  11. ax = fig.add_subplot(111, projection='3d')
  12. # 自定义颜色映射和标签
  13. cmap = plt.get_cmap('viridis')
  14. ax.plot_surface(X, Y, Z, cmap=cmap, label='Surface Plot')
  15. # 添加颜色条
  16. cbar = fig.colorbar(ax.plot_surface(X, Y, Z, cmap=cmap), ax=ax, pad=0.1)
  17. cbar.set_label('Values')
  18. # 添加标题
  19. ax.set_title('Customized 3D Surface Plot')
  20. # 自定义坐标轴标签
  21. ax.set_xlabel('X-axis')
  22. ax.set_ylabel('Y-axis')
  23. ax.set_zlabel('Z-axis')
  24. # 自定义坐标轴刻度
  25. ax.set_xticks(np.arange(-5, 6, 2))
  26. ax.set_yticks(np.arange(-5, 6, 2))
  27. # 自定义视角
  28. ax.view_init(elev=20, azim=45) # 仰角和方位角
  29. # 显示图形
  30. plt.tight_layout()
  31. plt.show()

上面代码中,创建了一个复杂的3D表面绘图,包括自定义颜色映射、颜色条、标签、标题、坐标轴标签、坐标轴刻度和视角。
根据自己的情况,可以更改颜色映射、调整标签、添加自定义标题等。

时间序列图

时间序列图(Time Series Plot):用于可视化时间序列数据,通常包括折线图和柱状图,以便观察时间趋势和季节性模式。
创建一个时间序列图,其中包含复杂的数据集和多个定制化参数:

  1. import matplotlib.pyplot as plt
  2. import numpy as np
  3. import pandas as pd
  4. # 创建示例数据集
  5. np.random.seed(0)
  6. dates = pd.date_range('2023-01-01', '2023-12-31', freq='D')
  7. num_series = 5
  8. data = np.random.randn(len(dates), num_series).cumsum(axis=0)
  9. # 创建时间序列图
  10. fig, ax = plt.subplots(figsize=(12, 6))
  11. # 自定义线条颜色和样式
  12. colors = ['b', 'g', 'r', 'c', 'm']
  13. linestyles = ['-', '--', '-.', ':', '-']
  14. for i in range(num_series):
  15. ax.plot(dates, data[:, i], label=f'Series {i+1}', color=colors[i], linestyle=linestyles[i])
  16. # 添加标题
  17. ax.set_title('Customized Time Series Plot')
  18. # 自定义X轴和Y轴标签
  19. ax.set_xlabel('Date')
  20. ax.set_ylabel('Value')
  21. # 添加图例
  22. ax.legend(loc='upper left')
  23. # 添加网格线
  24. ax.grid(linestyle='--', alpha=0.7)
  25. # 自定义X轴的日期刻度显示
  26. ax.xaxis.set_major_locator(plt.MaxNLocator(10)) # 最多显示10个日期刻度
  27. # 自定义日期刻度标签的格式
  28. from matplotlib.dates import DateFormatter
  29. date_format = DateFormatter('%b %d')
  30. ax.xaxis.set_major_formatter(date_format)
  31. # 自定义Y轴刻度范围
  32. ax.set_ylim(-10, 10)
  33. # 显示图形
  34. plt.tight_layout()
  35. plt.show()

上面代码中,自定义线条颜色和样式、标签、标题、坐标轴标签、图例、网格线、日期刻度显示和日期刻度标签的格式。
可以根据自己的需求继续自定义时间序列图,例如更改颜色、调整标签、添加自定义标题等。

树状图

树状图(Tree Diagram):用于可视化决策树、层次聚类等树状结构的数据。
使用networkx库来构建树的结构,并使用matplotlib进行可视化。

首先,需要安装networkx库:

pip install networkx

然后,可以使用以下代码进行绘制:

  1. import matplotlib.pyplot as plt
  2. import networkx as nx
  3. # 创建示例数据集
  4. G = nx.DiGraph()
  5. G.add_nodes_from([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
  6. G.add_edges_from([(1, 2), (1, 3), (2, 4), (2, 5), (3, 6), (3, 7), (4, 8), (4, 9), (5, 10)])
  7. # 创建树状图布局
  8. pos = nx.spring_layout(G, seed=42)
  9. # 自定义节点颜色和大小
  10. node_colors = ['#1f78b4' for _ in G.nodes()]
  11. node_sizes = [800 for _ in G.nodes()]
  12. # 创建树状图
  13. fig, ax = plt.subplots(figsize=(10, 8))
  14. # 绘制树状图
  15. nx.draw(G, pos, ax=ax, with_labels=True, node_color=node_colors, node_size=node_sizes,
  16. font_size=10, font_weight='bold', edge_color='gray', width=1.0, arrows=True)
  17. # 添加标题
  18. ax.set_title('Customized Tree Diagram')
  19. # 显示图形
  20. plt.tight_layout()
  21. plt.show()

包括自定义数据集、自定义节点颜色、大小、标签、标题、布局、边的颜色和宽度等。

最后

这些图表类型覆盖了数据分析和机器学习项目中的许多常见需求。根据具体的项目和数据,可以选择适合的图表类型来展示和分析数据。Matplotlib 提供了丰富的功能,使你能够自定义图表以满足特定的需求。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/115648
推荐阅读
相关标签
  

闽ICP备14008679号