当前位置:   article > 正文

SparkStream实时分析统计展示共享单车使用人数_基于spark的共享单车用户骑行数据分析

基于spark的共享单车用户骑行数据分析

实验结果展示

image

数据集

hour.csv

instant,dteday,season,yr,mnth,hr,holiday,weekday,workingday,weathersit,temp,atemp,hum,windspeed,casual,registered,cnt
1,2011-01-01,1,0,1,0,0,6,0,1,0.24,0.2879,0.81,0,3,13,16
  • 1
  • 2
  • 3
  • 4
此数据集包含的是从 2011 年 1 月 1 日到 2012 年 12 月 31 日期间每天每小时的骑车人数。骑车用户分成临时用户和注册用户,cnt 列是骑车用户数汇总列。你可以在上方看到前几行数据。

实验说明

将数据文件中每小时的骑车人数当做每10秒的使用人数使用,传入kafka中,由Spark实时读取并统计时间窗口中的使用人数,再传回kafka,界面实时展示时间窗口的统计结果
  1. python 读入数据集文件,并将使用人数字段每隔0.1s传入 kafka 队列
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/天景科技苑/article/detail/945526
推荐阅读
相关标签
  

闽ICP备14008679号