赞
踩
最近在做项目时需要用到python 实现数据的可视化,这里介绍自己的学习成果与各位交流。本文你将会下载一个足球运动员数据集,并作出有关该数据集的折线图
本文默认读者已经准备好了python的jupyter开发环境,并且有一定的python或者其他编程语言的基础,对编程的过程有一定的了解。
数据集是进行数据可视化的原料,在进行数据可视化之前,我们需要首先准备好一个数据集。如果我们没有自己的数据集,可以从 https://link.zhihu.com/?target=https%3A//www.crowdflower.com/wp-content/uploads/2016/03/Football-Scenarios-DFE-832307.csv 下载一个有关足球运动员的数据集,下文内容基于该数据集进行。
首先,请读者在jupyter中写下如下代码:
# 此句代码表示导入matplotlib.pyplot 代码包并用plt代指它。导入此段代码后可以在本python文件的任何地方使用这个代码包中的函数。
import matplotlib.pyplot as plt
# 下面两句代码含义类似,只不过代表导入另外两个不同的代码包
import pandas
import seaborn as sns
#下面这句代码的含义是指,可以将matplotlib画出的图直接显示在输出中:
%matplotlib inline
首先将下载的数据集和jupyter notebook放在同一个文件夹中,然后写下如下代码:
# 表示将数据集的路径赋值给一个变量football_path,这个变量下面要用
football_path = "./Football-Scenarios-DFE-832307.csv"
# 调用pandas的read_csv()函数,实现读取数据集。该函数需要赋一个参数,就是想要读取的数据集的路径,本例中为football_path
football_data = pd.read_csv(football_path)
# 测试前两句的成果,如果正确的话,本句代码将输出数据集的前5行的内容
football_data.head()
正确执行后,应该得到如下图:
|
下面我们要绘制我们的第一个折线图了:
输入代码:
# 调用seaborn代码包的lineplot()绘制折线图。本段代码绘制的是antecedent:confidence关于_trusted_judgments的折线图,
# x,y可以换成其他的数值型的特征,data参数赋值为前面定义的读取数据集的变量
sns.lineplot(x = football_data["_trusted_judgments"],y = football_data['antecedent:confidence'],data=football_data)
输出的图形如下:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。