当前位置:   article > 正文

python基于hadoop的外卖配送分析及可视化系统

python基于hadoop的外卖配送分析及可视化系统

(1)数据获取;本文中数据的获取方式是直接获取外卖配送分析及可视化分析。 
(2)数据清洗:本文数据清洗使用的是python语言,通过pycharm读取数据文件,并入库操作。在入库之前,剔除无用字段、标准化处理。
(3)数据分析:在数据库中使用sql语言多维度排序分析。
(4)分析结果展示与说明:将分析结果通过python绘制趋势图可视化展现。
本课题使用Python语言进行开发。基于web,代码层面的操作主要在PyCharm中进行,将系统所使用到的表以及数据存储到MySQL数据库中
技术栈
后端:python 
前端:vue.js+elementui
框架:django/flask
Python版本:python3.7+
数据库:mysql5.7
数据库工具:Navicat
开发软件:PyCharm .
(1)数据获取板块
数据获取板块功能主要是依据分析目的及要达到的目标,确定获取的数据种类,并使用直接获取数据文件方式或爬虫方式获取原始数据。
(2)数据预处理板块
数据预处理板块功能是对获取到的数据进行预处理操作:将重复的字段筛选,将过短并且没有实际意义的数据进行过滤,选择重要字段,标准化处理,异常值处理等预处理操作。
(3)数据存储板块
数据存储板块主要功能是把经过预处理的数据持久化存储,以便于后续分析。
(4)数据分析板块
数据分析板块主要功能是根据分析目标,找出数据中字段之间的内在关系,与规律。
(5)数据可视化板块
数据可视化板块主要功能是使用适当的图标展现方式,把数据的内在关系、规律展现出来。

随着社会的不断发展,互联网数据时代的到来,数据的背后是什么,数据有什么用,怎么用庞大的数据来呈现出数据的价值,让我们一起去揭开它神秘的面纱。
本次以外卖配送分析及可视化系统爬取为例,介绍网络爬虫的基本原理,Python环境的搭建,PyCharm scrapy模块的爬虫数据的运用,把获取到的数据进行清洗、整合,储存数据到MySQL,然后进行数据可视化的呈现,简单对呈现的图进行数据分析。
关 键 词:Python;MySQL;PyCharm;爬虫;数据分析;数据呈现。

   目录
摘要    I
Abstrac    II
1 绪论    1
1.1 背景及意义    2
1.1.1 背景    3
1.1.2 目标及意义    3
1.2 应用现状    4
1.3 主要板块    4
1.4 主要方法及技术路线    5
1.4.1 主要方法    5
1.4.2 技术路线    6
1.4.3实现途径    7
2开发环境及技术    8
2.1 软件硬件设备    8
2.1.1 其他    9
2.2 开发环境与工具    10
2.2.1 Python简介    10
2.2.2 爬虫简介    11
2.2.3 Django框架简介    12
2.2.4 MySqL数据库    13
2.2.5 hadoop简介    14
2.2.6 hive简介    14
3 可行性分析与模块设计    15
3.1 可行性分析    15
3.1.1 技术可行性分析    16
3.1.2 数据可获得性分析    17
3.2 各功能模块设计    18
3.2.1 数据获取方法    19
3.2.2 数据预处理设计    20
5 系统设计    22
4.1系统功能结构图    21
4.2系统数据库设计    21
4.2.1数据库E-R图    21
4.3数据库表结构    21
5 系统实现与结论    22
5.1 用户功能的实现    22
5.2管理员功能的实现    23
5.3数据可视化分析看板展示    25
5.4 结论    26
6总结    29
 致  谢     30
参考文献    31


 

本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号