赞
踩
目录
1. 图书数据展示
数据下载链接:chap7.csv(博客练习文件)-教育文档类资源-CSDN下载
2. 图书数据分析
从上面的数据中,我们可以发现这些图书数据分别是:图书的名称、评论数量、出版日期、出版社、原价和折后价。我们需要将其中的数据进行可视化,这里可以使用折线图进行可视化,其中横轴表示每本书的序号,纵轴表示每一项指标的具体取值。
下面选择评论数、折后价和原价、折扣率和出版日期四项数据来绘制折线图,实现图书数据的可视化。
3. 代码编写
- # -- coding: utf-8 --
- # 第一步:导入相关库
- import pandas as pd
- from pandas.plotting import register_matplotlib_converters
- import numpy as np
- import matplotlib.dates as mdates
- import matplotlib.mlab as mlab
- import matplotlib.pyplot as plt
- from datetime import datetime
-
- register_matplotlib_converters()
- plt.figure(figsize=(20, 15))
-
- # 第二步:读取CSV数据文件
- book_list = pd.read_csv('chap7.csv', sep=',')
- book_list['discount_rate']=book_list['price_discount']/book_list['price_original'] # 图书折扣率
-
- # 第三步:绘制第一个子图:评论数
- x=book_list['rank']
- ax1 = plt.subplot(221)
- y1=book_list['comment']
- ax1.plot(x,y1,'bD-')
-
- # 第三步:绘制第二个子图:折后价和原价
- ax2 = plt.subplot(222)
- y2=book_list['price_discount']
- y3=book_list['price_original']
- ax2.plot(x,y2,'r^-')
- ax2.plot(x,y3,'gH-')
-
- # 第三步:绘制第三个子图:折扣率
- ax3 = plt.subplot(223)
- y4=(book_list['discount_rate']*100).round(1)
- ax3.plot(x,y4,'ks-')
-
- # 第三步:绘制第四个子图:出版日期
- ax4 = plt.subplot(224)
- y5=[datetime.strptime(d, '%Y-%m-%d').date() for d in book_list['publish_date']]
- ax4.plot(x,y5,'m4-')
-
- # 第四步:图表展示
- plt.show()
4. 运行结果
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。