赞
踩
【 matplotlib 库绘制流程】
1、创建画布
2、规划画布为多个不同的绘图区域,并在不同区域创建需要的坐标系实例
3、准备数据(数据爬取 -> 数据清洗 -> 数据结构化。不同的数据数组,可能要求尺寸一致)
4、通过对应的坐标系实例,调用绘图方法,在当前坐标系实例中完成绘图
5、费时间最多:图表辅助元素的定制(比如:ax.set_ylim, ax.set_title, ax.set_xlabel)
6、分析这些图表,得出结论
一、示例题目:在一张独立的画布上绘制以下参考图中的五个图表
需求一:请用柱形图和折线图在同一个坐标系展示表1数据
需求二:请用饼图展示表2数据
需求三:请用堆积柱形图展示表3数据
需求四:请用雷达图展示表4数据
表1. 2014-2021年中国中医类医疗卫生机构诊疗量
年份(年) | 诊疗量(万人次) | 同比增速(%) |
2014 | 87430 | 7.40 |
2015 | 90912 | 4.00 |
2016 | 96225 | 5.83 |
2017 | 101885 | 5.81 |
2018 | 107147 | 5.16 |
2019 | 116390 | 8.63 |
2020 | 105764 | -9.13 |
2021 | 120215 | 13.66 |
表2. 中药材消费者画像数据
年龄 | 占比(%) |
20岁以下 | 2.2 |
20-30岁 | 27.9 |
31-40岁 | 56.2 |
41-50岁 | 10.9 |
51岁以上 | 2.8 |
表3. 全国药店中药饮片供应商占比情况
年份(年) | 跨国企业占比(%) | 本土企业占比(%) |
2019 | 20.3 | 79.7 |
2020 | 22.0 | 78.0 |
2021 | 23.5 | 76.5 |
2022 | 22.5 | 77.5 |
2023 | 22.3 | 77.7 |
表4. 全国药店药品销售额占比
药品类型 | 占比(%) |
化学药 | 33 |
中成药 | 45 |
生物制品 | 3 |
保健品 | 9 |
中药饮片 | 6 |
其他 | 4 |
二、示例代码如下:
- %matplotlib auto
- import numpy as np
- import matplotlib.pyplot as plt
-
- # 0. 【设置中文字体】
- plt.rcParams["font.sans-serif"] = ["SimHei"]
- plt.rcParams["axes.unicode_minus"] = False
-
- # 1.【可视化第一个表格数据(柱形和折线融合图)】
- # 1.1 准备数据
- year_x = np.arange(2014, 2022, 1) # X轴刻度值(2014-2021)
- data_num = np.array([87430, 90912, 96255, 101885, 107147, 116390, 105764, 120215]) # 诊疗量
- data_speed = np.array([7.40, 4.00, 5.83, 5.81, 5.16, 8.63, -9.13, 13.66]) # 同比增减
-
- # 面向函数的 API —— pyplot 模块下的函数
- # 面向对象的 API —— 坐标系类方法(直角坐标系,极坐标系)
-
- # 1.2 创建第一个坐标系实例
- ax = plt.subplot2grid((2, 3), (0, 0), colspan=3) # 直角坐标系实例
-
- # 1.3 在第一个坐标系实例上绘制堆积柱形图
- bar = ax.bar(year_x, data_num, width=0.5, color='orange')
-
- # 1.4 创建共享x轴的第二个坐标系实例
- ax_right = ax.twinx()
-
- # 1.5 在第二个坐标系实例绘制折线图
- line = ax_right.plot(year_x, data_speed, 'm^-')
-
- # 1.6 图表辅助元素定制
- ax.set_ylabel('诊疗量(万人次)')
- ax_right.set_ylabel('同比增速(%)')
- ax_right.set_ylim(-20, 20)
- ax.set_title('2014-2021年中国中医类医疗卫生机构诊疗量')
-
-
- # 2、【可视化第二个表格数据(饼图)】
- # 2.1 准备数据
- ratios = [2.2, 27.9, 56.2, 10.9, 2.8] # 各年龄段用户比例
- labels = ['20岁以下', '20-30岁', '31-40岁', '41-50岁', '51岁以上'] # 外侧说明文字
-
- # 2.2 创建坐标系实例并绘制饼图
- ax2 = plt.subplot2grid((2, 3), (1, 0))
- ax2.pie(ratios, labels=labels, radius=1,
- textprops={'fontsize': 6},
- wedgeprops={'width': 0.5},
- pctdistance=0.75, # 调整数值标签的位置
- autopct='%3.1f%%',
- startangle=0, # 调整购物品类的位置
- )
-
- # 2.3 图表辅助元素定制
- ax2.set_title('中药材消费者画像', fontsize=8, pad=5)
-
-
- # 3、【可视化第三个表格数据(堆积柱形图)】
-
- # 3.1 准备数据
- year_x = np.arange(2019, 2024, 1) # X轴刻度值(2019-2023)
- data1 = np.array([20.3, 22.0, 23.5, 22.5, 22.3]) # 跨国企业占比
- data2 = np.array([79.7, 78.0, 76.5, 77.5, 77.7]) # 本土企业占比
- xlabels = ['2019年', '2020年', '2021年', '2022年', '2023年']
-
- # 3.2 创建坐标系实例并绘制堆积柱形图
- ax3 = plt.subplot2grid((2, 3), (1, 1))
- bar_width = 0.5 # 柱宽
- ax3.bar(year_x, data1, width=bar_width)
- ax3.bar(year_x, data2, bottom=data1, width=bar_width)
-
- # 3.3 图表辅助元素定制
- ax3.set_title('全国药店中药饮片供应商占比', fontsize=6)
- ax3.set_xticks(year_x)
- ax3.set_xticklabels(xlabels, rotation=60, fontsize=8)
-
- # 4、【可视化第四个表格数据(雷达图)】
-
- # 4.1 准备数据
- # 各品类药品占比
- score = np.array([33, 45, 3, 9, 10])
- # 拼接一下,构成闭环
- score = np.concatenate((score, [score[0]]))
- # 维度标签
- radar_labels = ['化学药','中成药','生物制品','保健品','中药饮片']
- # 拼接一下,构成闭环(此处可以不拼接,为了统一而已)
- radar_labels = np.concatenate((radar_labels, [radar_labels[0]]))
- # 维度数(因为前面拼接了一下,所以要减1)
- dim_num = len(score)-1
- radians = np.linspace(0, 2 * np.pi, dim_num, endpoint=False)
- # 拼接一下,构成闭环
- radians = np.concatenate((radians, [radians[0]]))
-
- # 4.2 创建极坐标系实例,并绘制雷达图
- ax4 = plt.subplot2grid((2, 3), (1, 2), polar=True) # projection = 'polar'
- ax4.plot(radians, score, marker='o',
- markersize=2, linewidth=1, color='r')
-
- # 4.3 图表辅助元素定制
-
- # 设置极坐标的标签
- angles = radians * 180/np.pi # 弧度转角度
- # 设置新的刻度标签
- ax4.set_thetagrids(angles, labels=radar_labels, fontsize=6)
-
- # 填充多边形
- ax4.fill(radians, score, alpha=0.2)
- ax4.set_title('全国药店药品销售额占比', fontsize=8, pad=20)
-
-
- # 5、【展示图表】
-
- # 启用自动紧凑布局
- plt.tight_layout()
-
- plt.show()
三、图表展示
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。