当前位置:   article > 正文

Python实现的《数据处理与可视化》实验报告(温度和出行人数的比较、骑行长度和性别年龄)_数据分析与可视化实验报告

数据分析与可视化实验报告

目录
一、 实验内容 1
二、 数据读取 1

  1. import pandas as pd 1
    三、 数据清洗 2
    四、 数据可视化 2
    这是清洗前的数据,可以看到订阅用户占比为86.15% 5
    五、 相关性分析 9
  2. import pandas as pd 9
    六、 感想总结 12
    一、实验内容
    数据读取
    数据清洗
    数据可视化
    相关性分析
    二、数据读取
    首先,需要进行导包操作:
    1.import pandas as pd
    2.import numpy as np
    接着,用pandas来进行对csv中数据的读取:
    1.df = pd.read_csv(“201506-citibike-tripdata.csv”)
    2.print(df.head())
    输出前五行,得到如下结果:
    在这里插入图片描述

可以看到,读取成功。
四、数据可视化
数据可视化用到的工具有matplotlib.pyplot、pyecharts、seaborn和百度api(在pyecharts中调用绘制地图数据)。下面是我绘制的一些图像:
性别占比:
由于数据的局限性,我没有追加该地区男女比例的占比,这里仅仅展示骑行共享单车中的男女占比:

1.# 起点分布图  
2.def draw_start_station_pos():  
3.    list_station_val = read_start_pos()  
4.    c = (  
5.        BMap(init_opts=opts.InitOpts(width="2000px",height="1000px"))  
6.        .add_schema(baidu_ak="GF7GOq6CbjMcGfDvFGuIFjrCKYi3zeTy", center=[-73.99069656,40.72502876],zoom=15)  
7.        .add_coordinate_json("infor_start.json")  
8.        .add(  
9.            series_name="起点分布图",  
10.            type_="scatter",  
11.            data_pair=list_station_val  
12.        )  
13.        .set_global_opts(  
14.            title_opts=opts.TitleOpts(title="起点分布图"),  
15.            visualmap_opts=opts.VisualMapOpts(max_=5000),  
16.  
17.        )  
18.        .set_series_opts(label_opts=opts.LabelOpts(is_show=False))  
19.        .render("draw_start_station_pos.html")  
20.    )  
21.  
22.# 起点分布热力图  
23.def draw_start_station_pos_heat():  
24.    list_station_val = read_start_pos()  
25.    c = (  
26.        BMap(init_opts=opts.InitOpts(width="2000px",height="1000px"))  
27.        .add_schema(baidu_ak="GF7GOq6CbjMcGfDvFGuIFjrCKYi3zeTy", center=[-73.99069656,40.72502876],zoom=15)  
28.        .add_coordinate_json("infor_start.json")  
29.        .add(  
30.            series_name="起点分布图",  
31.            type_="heatmap",  
32.            data_pair=list_station_val  
33.        )  
34.        .set_global_opts(  
35.            title_opts=opts.TitleOpts(title="起点分布图"),  
36.            visualmap_opts=opts.VisualMapOpts(max_=12000,min_=0),  
37.  
38.        )  
39.        .render("draw_start_station_pos_heat.html")  
40.    )  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/798111
推荐阅读
相关标签
  

闽ICP备14008679号