赞
踩
赠人玫瑰
如今网上有非常多的数据集,在CSDN,知乎什么搜一下可以找到一大堆,在收集数据时,发现很多数据集整理的文章都是写的一些论文中以及经过预处理的数据,我感觉这样的数据在从新写论文时使用起来非常不方便,因为不知道很多细节,所以我想写一写我搜集数据时搜集到的数据。
推荐使用纽约公开数据集
推荐使用英国高速公路数据集
卡口、地铁等等
原地址
https://github.com/amirkhango/DeepST/blob/master/deepst/models/STConvolution.py
百度网盘分享
链接:https://pan.baidu.com/s/1LY7kg6EP_hkcdINrm_szHg
提取码:0zhl
https://www1.nyc.gov/site/tlc/about/tlc-trip-record-data.page
滴滴盖亚计划数据集,链接就不放了。一搜就有
GeoLife GPS Trajectories
该GPS轨迹数据集出自微软研究GeoLift项目。从2007年四月到2012年八月收集了182个用户的轨迹数据。这些数据包含了一系列以时间为序的点,每一个点包含经纬度、海拔等信息。包含了17621个轨迹,总距离120多万公里,总时间48000多小时。这些数据不仅仅记录了用户在家和在工作地点的位置轨迹,还记录了大范围的户外活动轨迹,比如购物、旅游、远足、骑自行车。
https://www.microsoft.com/en-us/download/details.aspx?id=52367
https://www.microsoft.com/en-us/research/publication/t-drive-trajectory-data-sample/
还有其他的数据集,大同小异,我感觉如何是分析出租车出行需求,使用上面这些,特别是纽约的就足够了,纽约数据集非常详细。
如果是要做这方面的,我有一些小小的思路
对数据进行处理方面
(方法一) 将数据根据经纬度与街道进行匹配,就像下面的图
(方法二) 将地图网络分成若干个小区域,
模型方法方面
方法一 CNN+LSTM CNN卷积图片,提取空间信息形成包含空间数据的时间序列,输入LSTM,预测
方法二 GCN 图卷积神经网络,这个还是比较新颖的,网上也有很多文章,就不展开说了(太菜)
https://codechina.csdn.net/mirrors/wanhuaiyu/ASTGCN?utm_source=csdn_github_accelerator
内容包括
https://codechina.csdn.net/mirrors/liyaguang/DCRNN?utm_source=csdn_github_accelerator
内容包括
Los Angeles (METR-LA) :207个检测器2012年四个月的数据
the Bay Area (PEMS-BAY):325个检测器2017年6个月的数据
github 上各个领域公开的数据集 {https://github.com/awesomedata/awesome-public-datasets#transportation}, 里面包含很多数据集的内容,需要你花点时间去找,不只有交通的,还有其他的数据集,不多说可以看一下。
美国一个大学提供的双子城{https://www.d.umn.edu/tdrl/services.htm}, 附近道路数据,但是数据格式一直没搞懂,如果有弄明白的朋友可以讨论交流一下。
上面这些,我其实并不是特别满意,太麻烦了,而且还需要看全英文的论文网页什么的,于是,不断的找啊找,终于
找到了 英国高速公路数据集{http://tris.highwaysengland.co.uk/detail/trafficflowdata},数据集网站包含英国M、A级基本上所有高速公路,数据非常全面,而且国内下载不限速 ,缺点就是只是统计时间是15分钟一次。
但这个网站只有数据没有观测点的位置,于是又经过不断的找啊找,观测点地图{https://webtris.highwaysengland.co.uk/}, 也终于找到了,这两个一起,真就再也不用担心数据了,想要多少有多少
2021.7.29更新 英国高速数据网站也需要翻墙,请大家继续寻找别的数据集。
提供一个我已经下载的7个站点2个月的数据,位置在M25高速希思罗机场附近
链接:https://pan.baidu.com/s/1ykUKfGcjIsfCMHJbmky6NQ
提取码:mq0v
这一方面也有一些的小思路,但不详细说了,因为现在就在写这方面的论文,等论文写差不多在写专门的方法实现文章吧,如果有人想一起讨论,可以私聊,欢迎欢迎。
cnn+lstm+注意力
增加特定条件(天气呀,重大事件呀巴拉巴拉)
针对特定场景,使用现有模型去套到新的应用方向上
天池比赛
https://tianchi.aliyun.com/competition/entrance/231708/introduction?spm=5176.12281957.1004.5.38b04c2alLBS7L数据链接:https://pan.baidu.com/s/1wb6cXjSzFh9sy6jGB8aShQ
提取码:7g44
江西的一个比赛,提供下载
https://data.jiangxi.gov.cn/jxoda/login/toPages?file=home/quesData
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。