搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
Monodyee
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
基于node的毕业设计学生宿舍寝室管理系统
2
创建Git本地仓库并同步远程Github_github本地项目同步
3
使用Python解决汉诺塔问题_python汉诺塔
4
搭建测试环境遇到的问题_net-tools is needed by mysql-community-server-8.0.
5
GitHub 干货 | 各大数据竞赛 Top 解决方案开源汇总_百度 光伏 数据 竞赛 github, bing
6
bert模型简介、transformers中bert模型源码阅读、分类任务实战和难点总结_bert模型难点
7
Android中的设计模式之代理模式_android代理模式的应用场景
8
Java类加载_-xx:reservedcodecachesize
9
spring的refresh
10
python每日一题——8无重复字符的最长子串_无重复字符的最长子串 python
当前位置:
article
> 正文
论文笔记;LargeST: A Benchmark Dataset for Large-ScaleTraffic Forecasting
作者:Monodyee | 2024-04-27 15:43:56
赞
踩
论文笔记;LargeST: A Benchmark Dataset for Large-ScaleTraffic Forecasting
Neurips
2023
1 intro
目前交通预测数据集的问题
规模小,通常只包含数百个节点和边
在时间覆盖范围上存在严重不足,通常不超过6个月
单个节点的元数据不足
——> 提出了一个新的基准数据集LargeST
广泛的图大小,包括加利福尼亚州的8,600个传感器
丰富的时间覆盖和丰富的节点信息——每个传感器包含5年的数据和全面的元数据
liuxu77/LargeST: LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting (NeurIPS 2023 DB Track) (github.com)
2 LargeST数据集
2.1 数据收集和组织
PeMS提供来自加州州际公路系统中18,954个传感器的实时交通数据。
为确保LargeST数据集代表整个系统的整体交通状况,论文特意选择标记为“主线”的传感器,还排除了缺少坐标信息或与其他传感器距离极远的传感器。
——>获得了一个包含8,600个传感器的数据集(CA)
为了对加州不同地区的交通模式进行更细致的分析,论文通过选择CA内的三个代表性区域构建了三个CA子集
GLA,包括大洛杉矶地区5个县的3,834个传感器:洛杉矶、橙县、河滨、圣贝纳迪诺和文图拉
GBA,包括大湾区11个县的2,352个传感器:阿拉米达、康特拉科斯塔、马林、纳帕、圣贝尼托、旧金山、圣马特奥、圣克拉拉、圣克鲁斯、索拉诺和索诺马
SD,仅包括圣迭戈县的716个传感器
除了县信息,还为每个节点提供其他元数据,包括它们的坐标、在PeMS中的区域、所在的高速公路、行驶方向和车道数
为了构建传感器图的邻接矩阵,论文利用Open Source Routing Machine,一个在OpenStreetMap数据上运行的高性能路由引擎,查询基于坐标的传感器之间的最短驾驶距离
然而,计算成对的道路网络距离在处理大量节点时可能非常耗时
——>首先计算传感器之间的测地线距离,这比计算它们之间的最短路径要快得多
——>然后,限制每个节点只查询与其相距4公里半径内的其他节点的道路网络距离
——>最后,通过设置一个小阈值来规范化邻接矩阵,该阈值消除了弱节点连接
LargeST包含五年(2017年至2021年)的交通流量数据,时间间隔为5分钟(与PeMS相同),总共有525,888个时间帧
论文选择
不移除具有高缺失交通流量值的节点
,以便用户可以自行决定是否填补缺失值
2.2 数据分析
3 实验
基于12步历史数据预测未来12步
训练集、验证集和测试集的比例为6:2:2
3.1 实验结果
3.1.1 各模型效果
3.1.2 效率比较
4 未来研究中的机会
空间、时间和元数据特征的利用
。
时间分布转移挑战的有价值试验场
。
数据集提供了一个独特的视角来观察时间分布转移或分布外挑战。
例如,研究人员探索非常事件对预测模型的影响时,可以利用该数据集作为一个测试场,以开发处理突然分布转移的策略。
简单而有效方法的开发
。
通过分析表2和表3,显而易见的是,尽管提出的方法在近年来展示了越来越高的准确性,但它们的模型也变得越来越复杂,这对它们在更大传感器网络中的效率和可扩展性有重大影响。
因此,开发简单而有效的交通预测方法是至关重要的,以便在现实世界应用中实际实施和部署。
基础预测模型的开发
。
最近,开发基础模型在多个领域引起了广泛兴趣,例如自然语言处理中的ChatGPT和计算机视觉中的Segment Anything。拥有数十亿精选数据点的我们的数据集可能成为在交通预测或时间序列预测领域培训基础模型的宝贵资源。
本文内容由网友自发贡献,转载请注明出处:
【wpsshop博客】
推荐阅读
article
第一个现象级音乐生成产品
Suno
;
GenAI
动画技能全图;超级个体的技术写作手册;大
语言
模型
入门新书...
日报关键词:AI冲击书籍与阅读;音乐生成工具
Suno
.ai;用LLM生成歌词;AI炒股公司;回望大
模型
的一年;
GenAI
...
赞
踩
article
MiniGPT
-4:
Enhancing
Vision
-
Language
Understanding...
近年来,大型语言模型(LLM)经历了非常迅速的进步。凭借出色的语言理解能力,这些模型可以以zero-shot的方式执行各...
赞
踩
article
UNDERSTANDING
YOUR
AGENT
:
LEVERAGING
LARGE
LANGUAG...
机器人等智能代理越来越多地部署在现实世界中对安全至关重要的环境中。至关重要的是,这些代理能够向人类同行解释其决策背后的原...
赞
踩
article
Shortcut
Learn
in
g
of
Large
Language
Models
in
Natu...
NLP中一些捷径学习的工作总结。挺有意思。
Shortcut
Learn
in
g
of
Large
Language
Mod...
赞
踩
article
Underst
and
ing
Large
Language
Models
-TianQi Chen_se...
1. 中文解读中文解读3. 中文解读4. 中文解读。_
self
-diagnosis
and
self
-debiasing...
赞
踩
article
【
CCTC
: A
Cross
-
Sentence
Chinese
Text
Correction
Da...
CCTC
: A
Cross
-
Sentence
Chinese
Text
Correction
Dataset
for N...
赞
踩
article
【论文笔记】RS-
Mamba
for
Large
Remote
Sensing
Image
Dens...
论文作者提出了RS-
Mamba
(RSM)用于高分辨率遥感图像遥感的密集预测任务。RSM设计用于模拟具有线性复杂性的遥感图...
赞
踩
article
论文笔记:
Spatial
-
Temporal
Large
Language
Model
for Tra...
arxiv 2024 时空+大模型。论文笔记:
Spatial
-
Temporal
Large
Language
Model
...
赞
踩
article
How Can
Large
Language
Models
Understand
Spatial
-T...
虽然大型语言模型(LLM)在自然语言处理和计算机视觉等任务中占据主导地位,但利用它们的能力进行时空预测仍然具有挑战性。连...
赞
踩
article
A Survey on Large
Language
Model
based
Autonomous ...
自主代理一直是学术界和工业界的研究重点。以前的研究通常集中在训练在孤立环境中具有有限知识的代理,这与人类学习过程相差甚远...
赞
踩
article
An In-
depth
Survey of Large Language Model-based A...
由于大语言
模型
(LLM)所展示的强大功能,最近人们纷纷将其与人工
智能
代理
集成以提高其性能。本
论文
探讨了
基于
LLM的AI代...
赞
踩
article
在C#内存中存
数据
集(
DataSet
,
DataTable
,
DataColumn
类的使用)_datas...
1.展示效果(设置断点)_
dataset
ds
=
new
dataset
()新建
table
dataset
ds
= n...
赞
踩
article
stable
-
diffusion
-
webui
报OSError: Can‘t
load
tokeni
z...
把repo clone到
openai
文件夹就行了。何必要用硬编码呢,完全违反软件工程实践。则需要在标红的目录下新建ope...
赞
踩
article
Stable Diffusion WebUi云端部署配置记录_
models
-
openai
-
clip
-...
服务器部署sdwebui项目,远程浏览器访问ui界面。服务器可租用AutoDL的GPU服务器租用AutoDL的GPU服务...
赞
踩
article
基于
llava
-v1.5-7b大模型的图片理解_
clip
-
vit
-
large
-
patch14
...
基于
llava
-v1.5-7b大模型的图片理解_
clip
-
vit
-
large
-
patch14
clip
-
vit
-
large
...
赞
踩
article
论文笔记:
Time
-LLM:
Time
Series
Forecasting
by Reprogra...
iclr 2024 reviewer 评分 3888。论文笔记:
Time
-LLM:
Time
Series
Foreca...
赞
踩
article
【
LLM
安全
】
Privacy
in Large Language Models:
Attacks
, ...
SMPC协议优化( SMPC Protocol Optimization,SPO )是指利用先进的SMPC协议,在保持原...
赞
踩
article
实时追踪科研动态丨7.20精选新论文,附
ChatPaper
综述_
challenges
and
app...
此外,作者构建了一个专业的多视图系统来捕捉数据,其中包含60个同步摄像机,最大分辨率4096 x 3000,15帧/秒的...
赞
踩
article
A Survey on Large
Language
Model
based
Autonomous ...
自主代理一直是学术界和工业界的研究重点。以前的研究通常集中在训练在孤立环境中具有有限知识的代理,这与人类学习过程相差甚远...
赞
踩
article
K-
Means
算法
完整代码_实验九:
k
-
means
dataset
=
x
k
=
3 #请补全代码...
K-
Means
算法
完整代码_实验九:
k
-
means
dataset
=
x
k
=
3 #请补全代码实验九:
k
-mean...
赞
踩
相关标签
语言模型
人工智能
自然语言处理
深度学习
pytorch
论文阅读
机器学习
大数据