赞
踩
通过本次实验掌握数据获取、数据清洗与存储和数据可视化工具的基本使用方法。
操作系统:window10
python版本:3.8
IDE:pycharm
可视化工具:echarts
考核要点: 尽可能全面的获取疫情数据,包括国内、国外的疫情历史数据,越新越好,而且疫苗接种数量等信息也尽量获取。老师会根据数据的全面程度给定分数。推荐采用爬虫方式获取数据,如果有困难的话,可以采用网上别人整理好的数据。关于数据源,可以从世界卫生组织、丁香园、腾讯新闻等渠道获取,网上有很多资料可以参考。
数据来源1:爬取腾讯疫情数据的json格式网页
数据来源2:约翰斯·霍普金斯大学GitHub疫情数据
考核要点: 要对获取的疫情相关数据进行清洗,去掉冗余数据。关于数据存储,可以采用csv文件,但是欢迎大家尝试采用关系数据库(如MySQL、SQLite等轻量级数据库)或NoSQL数据库(如MongoDB)等方式存储数据。
获取中国、美国的现存确诊人数、累计死亡人数、累计治愈人数,以字典方式存储
获取中国各省累计确诊人数
获取中国、美国各省各州累计确诊人数和累计死亡人数列表
读取疫情数据csv文件,获取7个时间节点中国各省累计确诊新冠的人数
获取并处理中国、美国、印度、意大利7个时间节点累计确诊,累计死亡,累计治愈的人数
考核要点: 针对获取的疫情数据,从多角度以可视化的方式展现COVID-19疫情的发展过程。统计COVID-19疫情的地理分布,包括国际和国内。关于可视化的工具,可以采用Python或R,有很多功能强大的包,网上也有很多资料,大家可以参考。
采用五种echarts图表
效果图
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。