当前位置:   article > 正文

6种python数据可视化工具,python数据可视化工具包_python可视化

python可视化

大家好,给大家分享一下数据可视化属于python应用领域吗,很多人还不知道这一点。下面详细解释一下。现在让我们来看看!

什么是数据可视化?数据可视化是为了使得数据更高效地反应数据情况,便于让读者更高效阅读,通过数据可视化突出数据背后的规律,以此突出数据中的重要因素,如果使用Python做数据可视化,建议学好如下这四个Python数据分析包,分别是:

Pandas、Matplotlib、Seaborn、Pyecharts

学好以上四个数据分析包,做可视化足够用了,全文较长,建议耐心看完,学习后即可使用Python做数据可视化,具体的代码实操部分可以实际用代码进行演示,这样才能更好的掌握,下面一起来学习~

05b75e5204d95f221a482647789fbf79.gif

01. Pandas

官网https://www.pypandas.cn/

Pandas 是 Python的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据,广泛应用于数据分析领域,Pandas 适用于处理与 Excel 表类似的表格数据,以及有序和无序的时间序列数据等。

Pandas 的主要数据结构是 Series(一维数据)和 DataFrame(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例,使用pandas进行数据分析流程包含数据整理与清洗、数据分析与建模、数据可视化与制表等阶段python新手代码练习

  • 灵活的分组功能:group by数据分组;

  • 直观地合并功能:merge数据连接;

  • 灵活地重塑功能:reshape数据重塑;

cf1719bfc1720764313168542c95e188.jpeg

pandas库不仅可以做一些数据清洗的工作,还可以使用pandas作图,并且做图时,使用一行代码就可以轻松作图,详细的作图方法可以看代码中的注释。

  1. #导入pandas库
  2. import pandas as pd
  3. #生成一个Series
  4. s=pd.Series([1,3,3,4], index=list('ABCD'))
  5. #括号内不指定图表类型,则默认生成直线图
  6. s.plot()

aba3cea960ebfcc7419765b7c1e0db91.jpeg

  1. #条形图
  2. s.plot(kind='bar')

177c9da8582b9350edb81729012205e5.jpeg

  1. #水平条形图
  2. s.plot.barh()

dc74ce48b3b3e1e9e92c9a9e7f35810d.jpeg

  1. #饼图
  2. s.plot.pie()

5b0d73a31720ec2bcadd832723058097.jpeg

  1. #直方图
  2. s.plot.hist()

a105c0f9a6b917abc758daedd0ebe883.jpeg

  1. #密度图
  2. import numpy as np
  3. s=pd.Series(np.random.randn(1000)) #生成一列随机数
  4. s.plot.kde()
  5. s.plot.density()

7a254df08046ea6bf2b1285452f5bac3.jpeg

  1. #散点图
  2. import numpy as np
  3. #生成一个DataFrame
  4. df=pd.DataFrame(np.random.randn(1000,2),
  5. columns=['X1','Y'])
  6. df.plot.scatter(x='X1',y='Y')

914ad80e395729a4240328e1e5437578.jpeg

  1. #六角箱图
  2. df.plot.hexbin(x='X1',y='Y',gridsize=8)

59444252262cade9eda0a9cc491af5fc.jpeg

  1. #箱型图
  2. df=pd.DataFrame(np.random.rand(10,2),columns=['A','B'])
  3. df.plot.box()

a16d84328775127df8730dfee3a7eeb0.jpeg

  1. #面积图
  2. df=pd.DataFrame(np.random.randint(10,size=(4,4)),
  3. columns=list('ABCD'),
  4. index=list('WXYZ'))
  5. df.plot.area()

221a774d1e5be8d0a93e7b8581842404.jpeg

02. Matplotlib

官网https://www.matplotlib.org.cn/

Matplotlib是一个Python 2D绘图库,它以多种硬拷贝格式和跨平台的交互式环境生成出版物质量的图形。Matplotlib可用于Python脚本,Python和IPython Shell、Jupyter笔记本,Web应用程序服务器和四个图形用户界面工具包。

Matplotlib 尝试使容易的事情变得更容易,使困难的事情变得可能,只需几行代码就可以生成图表、直方图、功率谱、条形图、误差图、散点图等。

为了简单绘图,该 pyplot 模块提供了类似于MATLAB的界面,尤其是与IPython结合使用时,对于高级用户,您可以通过面向对象的界面或MATLAB用户熟悉的一组功能来完全控制线型,字体属性,轴属性等。

401e687414a570b919f57fab27a403fe.jpeg

下面介绍matplotlib的用法,使用matplotlib除了可以作图外,还可以对于图表的参数做一些调整,使得图表更加美观,关于使用matplotlib的建议,可以做一些常用的图表模板,更换代码的数据源就可以生成图表,而不用一点一点的去调整参数。

  1. #导入模块
  2. import matplotlib.pyplot as plt
  3. #设置风格
  4. plt.style.use('seaborn-white')
  5. #中文显示问题,如果没有这段代码,图表不显示中文汉字
  6. plt.rcParams['font.sans-serif'] =['SimHei']

这里首先导入matplotlib库,并使用了seaborn-white的图表风格,可以使用plt.style.available 查看图表的风格,选择一个自己喜欢的图表风格,在图表中不能显示汉字,使用一段代码就可以显示了。

  1. #构建一个DataFrame
  2. import pandas as pd
  3. import matplotlib.pyplot as plt
  4. df=pd.DataFrame({'X':[1,3,5,7]})
  5. df['Y']=df['X']**3
  6. df

e21207ac13250196f2df95f82f54a601.jpeg

  1. #设置图像的大小
  2. plt.figure(facecolor='white',figsize=(9,6),dpi=100)
  3. plt.plot(df['X'],df['Y'])
  4. #设置图像的标题
  5. plt.title('折线图',fontsize=15,color='b')
  6. #设置图像的X、Y轴标题大小,颜色,与坐标轴的距离
  7. plt.xlabel('X轴',fontsize=10,color='r',labelpad=15)
  8. plt.ylabel('Y轴',fontsize=10,color='g',rotation=0,labelpad=15)
  9. #设置起始坐标点
  10. plt.xlim([1,8])
  11. plt.ylim([1,350])
  12. #plt.xticks([1,2,3,4])只显示1,2,3,4
  13. #plt.yticks([50,150,250,300])只显示50,150,250,300
  14. #图像的网格线进行设置
  15. plt.grid(color='r', linestyle='-.')

这里首先设置图像的大小,跟我们画画一样,选择多大的纸张去作图,一样的道理,然后设置坐标轴,起始坐标,网格线等。

6a3c2978ddb94c17c074e61a1ac2832e.jpeg

有时候,要在一张图表上绘制多条线。

  1. #多个图的绘图方法
  2. import numpy as np
  3. import matplotlib.pyplot as plt
  4. x=np.array([1,3,5])
  5. y1=x
  6. y2=x * 10
  7. y3=x * 20
  8. y4=x * 30

可以在一个plt.plot命令后继续加另一个plt.plot命令,可以在一张图上做另一条线。

  1. plt.figure(facecolor='white')
  2. plt.plot(x,y1,label='A')
  3. plt.plot(x,y2,label='B')
  4. plt.plot(x,y3,label='C')
  5. plt.plot(x,y4,label='D')
  6. plt.legend()#显示图例

466b6570340a6e1ddcbe4b623e8d9006.jpeg

使用plt.subplots命令也可以作出同样的图。

  1. #使用面向对象绘图
  2. fig,ax=plt.subplots(facecolor='white')
  3. plt.plot(x,y1,label='A')
  4. plt.plot(x,y2,label='B')
  5. plt.plot(x,y3,label='C')
  6. plt.plot(x,y4,label='D')
  7. plt.legend()#显示图例

e91c2aa0148acc32ae2d134d206d67ed.jpeg

多表绘制

下面介绍在一张图表的不同位置绘制不同的线型,使用plt.subplot命令首先确定绘图的位置,比如plt.subplot(223)表示在2*2分布的图表中第三个位置,其余的绘图命令相似。

  1. plt.figure(facecolor='white',figsize=(9,6))
  2. plt.subplot(221)
  3. plt.plot(x,y1,label='A',color='r')
  4. plt.xticks(fontsize=15)
  5. plt.legend()#显示图例
  6. plt.subplot(222)
  7. plt.plot(x,y2,label='B',color='y')
  8. plt.xticks(fontsize=15)
  9. plt.legend()#显示图例
  10. plt.subplot(223)
  11. plt.plot(x,y3,label='C',color='b')
  12. plt.xticks(fontsize=15)
  13. plt.legend()#显示图例
  14. plt.subplot(224)
  15. plt.plot(x,y4,label='D',color='g')
  16. plt.xticks(fontsize=15)
  17. plt.legend()#显示图例
  18. plt.tight_layout()#密集显示

e716e068a387da28f83f88e35c5a13dd.jpeg

除了使用plt.subplot命令确定绘图区域外,还可以用axs[ ]命令绘图,这种绘图方式是面向对象的绘图方式。

  1. #面向对象绘制多图
  2. fig,axs=plt.subplots(2,2,facecolor='white',figsize=(9,6))
  3. axs[0,0].plot(x,y1,label='A',color='r')
  4. axs[0,1].plot(x,y2,label='B',color='y')
  5. axs[1,0].plot(x,y3,label='C',color='b')
  6. axs[1,1].plot(x,y4,label='D',color='g')

836a0106fb4d3976f2bba3d3b7baa7dd.png

有时候绘制多张表时需共享一个坐标轴,可以使用sharex='all'命令。

  1. #sharex='all'共享X轴
  2. fig,axs=plt.subplots(4,1,facecolor='white', figsize=(9,6), sharex='all')
  3. axs[0].plot(x,y1,label='A',color='r')
  4. axs[1].plot(x,y2,label='B',color='y')
  5. axs[2].plot(x,y3,label='C',color='b')
  6. axs[3].plot(x,y4,label='D',color='g')

f1a21a4339cab5a9ff345c346b536039.png

设置全局变量

使用plt.rcParams命令对全局变量设置,包括字符显示、中文显示、背景颜色、标题大小、坐标轴字体大小,线型等。

  1. #导入模块
  2. import matplotlib.pyplot as plt
  3. #设置风格
  4. plt.style.use('seaborn-white')
  5. #设置全局变量
  6. plt.rcParams['axes.unicode_minus'] = False #字符显示
  7. plt.rcParams['font.sans-serif'] =['SimHei'] #中文显示
  8. plt.rcParams['figure.facecolor'] = 'b' #设置图表背景颜色
  9. plt.rcParams['axes.facecolor'] = (0.8,0.9,0.8) #设置RGB颜色
  10. plt.rcParams['axes.titlesize'] = 20 #设置标题大小
  11. plt.rcParams['axes.labelsize'] = 20 #设置轴大小
  12. plt.rcParams['xtick.labelsize'] = 20 #设置X坐标大小
  13. plt.rcParams['ytick.labelsize'] = 20 #设置Y坐标大小
  14. plt.rcParams['lines.linestyle'] = '-.' #设置线型
  15. plt.plot(x,y1,label='A')
  16. plt.plot(x,y2,label='B')
  17. plt.plot(x,y3,label='C')
  18. plt.plot(x,y4,label='D')
  19. plt.title('折线图')
  20. plt.xlabel('X轴')
  21. plt.ylabel('Y轴')
  22. plt.legend()#显示图例

下图就是通过设置全局变量做的图,个人觉得并不美观,对于其他图表全局变量的设置,大家可以探索,做出更好看的图表。

137e0ab2c11282944ee453d8717048a0.jpeg

03. Seaborn

官网http://seaborn.pydata.org/

Seaborn 是一个基于matplotlib的 Python 数据可视化库,它建立在matplotlib之上,并与Pandas数据结构紧密集成,用于绘制有吸引力和信息丰富的统计图形的高级界面。

Seaborn 可用于探索数据,它的绘图功能对包含整个数据集的数据框和数组进行操作,并在内部执行必要的语义映射和统计聚合以生成信息图,其面向数据集的声明式 API可以专注于绘图的不同元素的含义,而不是如何绘制它们的细节。

Matplotlib 拥有全面而强大的 API,几乎可以根据自己的喜好更改图形的任何属性,seaborn 的高级界面和 matplotlib 的深度可定制性相结合,使得Seaborn既可以快速探索数据,又可以创建可定制为出版质量最终产品的图形。

35f813e942e98fff31d55e59dbf39ac6.jpeg

绘制多行图

将变量按照多行的形式进行绘制,使用sns.FacetGrid命令。

  1. import numpy as np
  2. import pandas as pd
  3. import seaborn as sns
  4. import matplotlib.pyplot as plt
  5. sns.set_theme(style="white", rc={"axes.facecolor": (0, 0, 0, 0)})
  6. rs = np.random.RandomState(1979)
  7. x = rs.randn(500)
  8. g = np.tile(list("ABCDEFGHIJ"), 50)
  9. df = pd.DataFrame(dict(x=x, g=g))
  10. m = df.g.map(ord)
  11. df["x"] += m
  12. pal = sns.cubehelix_palette(10, rot=-.25, light=.7)
  13. g = sns.FacetGrid(df, row="g", hue="g", aspect=15, height=.5, palette=pal)
  14. g.map(sns.kdeplot, "x",
  15. bw_adjust=.5, clip_on=False,
  16. fill=True, alpha=1, linewidth=1.5)
  17. g.map(sns.kdeplot, "x", clip_on=False, color="w", lw=2, bw_adjust=.5)
  18. g.refline(y=0, linewidth=2, linestyle="-", color=None, clip_on=False)
  19. def label(x, color, label):
  20. ax = plt.gca()
  21. ax.text(0, .2, label, fontweight="bold", color=color,
  22.             ha="left", va="center", transform=ax.transAxes)
  23. g.map(label, "x")
  24. g.figure.subplots_adjust(hspace=-.25)
  25. g.set_titles("")
  26. g.set(yticks=[], ylabel="")
  27. g.despine(bottom=True, left=True)

46ffd2fe79fd6ee60c34ae3461847e2f.png

绘制热力图

将数据的大小用热力图进行呈现,使用sns.heatmap命令。

  1. import matplotlib.pyplot as plt
  2. import seaborn as sns
  3. sns.set_theme()
  4. # Load the example flights dataset and convert to long-form
  5. flights_long = sns.load_dataset("flights")
  6. flights = flights_long.pivot("month", "year", "passengers")
  7. # Draw a heatmap with the numeric values in each cell
  8. f, ax = plt.subplots(figsize=(9, 6))
  9. sns.heatmap(flights, annot=True, fmt="d", linewidths=.5, ax=ax)

947459fcf22dcc08a1014fae0200dc28.jpeg

04. Pyecharts

官网https://pyecharts.org/#/

Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了。

Pyecharts具有简洁的 API 设计,使用如丝滑般流畅,支持链式调用,囊括了 30+ 种常见图表,应有尽有,支持主流 Notebook 环境,Jupyter Notebook 和 JupyterLab,拥有高度灵活的配置项,可轻松搭配出精美的图表。

Pyecharts强大的数据交互功能,使数据表达信息更加生动,增加了人机互动效果,并且数据呈现效果可直接导出为html文件,增加数据结果交互的机会,使得信息沟通更加容易。

a43d2fbbea10ef565e697eb309e347e4.jpeg

绘制地图

Pyecharts有着丰富的图表素材,支持链式调用,如下是使用Pyecharts的地理图表功能,空间上直观显示数据可视化效果。

  1. from pyecharts import options as opts
  2. from pyecharts.charts import Map
  3. from pyecharts.faker import Faker
  4. c = (
  5. Map()
  6. .add("商家A", [list(z) for z in zip(Faker.provinces, Faker.values())], "china")
  7. .set_global_opts(
  8. title_opts=opts.TitleOpts(title="Map-VisualMap(分段型)"),
  9. visualmap_opts=opts.VisualMapOpts(max_=200, is_piecewise=True),
  10. )
  11. .render("map_visualmap_piecewise.html")
  12. )

7b42cdee5049434d646f18e886d38dfa.jpeg

绘制雷达图

使用Radar命令绘制出雷达图,用来显示多变量数据的图形方法。

  1. from pyecharts import options as opts
  2. from pyecharts.charts import Radar
  3. v1 = [[4300, 10000, 28000, 35000, 50000, 19000]]
  4. v2 = [[5000, 14000, 28000, 31000, 42000, 21000]]
  5. c = (
  6. Radar()
  7. .add_schema(
  8. schema=[
  9. opts.RadarIndicatorItem(name="销售", max_=6500),
  10. opts.RadarIndicatorItem(name="管理", max_=16000),
  11. opts.RadarIndicatorItem(name="信息技术", max_=30000),
  12. opts.RadarIndicatorItem(name="客服", max_=38000),
  13. opts.RadarIndicatorItem(name="研发", max_=52000),
  14. opts.RadarIndicatorItem(name="市场", max_=25000),
  15. ]
  16. )
  17. .add("预算分配", v1)
  18. .add("实际开销", v2)
  19. .set_series_opts(label_opts=opts.LabelOpts(is_show=False))
  20. .set_global_opts(
  21. legend_opts=opts.LegendOpts(selected_mode="single"),
  22. title_opts=opts.TitleOpts(title="Radar-单例模式"),
  23. )
  24. .render("radar_selected_mode.html")
  25. )

ac29fd237618a96104ec932c33e25def.jpeg

以上介绍pandas如何绘制图表,同时引申matplotlib库的使用,并且介绍Seaborn和Pyecharts这两个数据可视化库,加以了解Python数据可视化内容,同时在数据可视化中学习多表绘制和设置全局变量,相信通过以上的学习,一定能对你学习Python数据可视化有所启发。

—  —

对比Excel系列新书《对比Excel,轻松学习Python统计分析》已经上线全网销售,原价89、全彩印刷,现价5折。点击下方链接即可购买。

文章知识点与官方知识档案匹配,可进一步学习相关知识
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/466162
推荐阅读
相关标签
  

闽ICP备14008679号