赞
踩
12月11日,中山大学智能工程学院副院长蔡铭教授来单位做报告,汇报基于手机信令数据的交通研究技术方法,很受启发。
我认为,蔡教授团队研究出发点是如何应用手机信令这一大数据来构建完整出行链,以解决交通出行中的诸多问题,如出行的起点、终点,出行的线路选择,出行方式,出行用户画像,人车关联。研究亮点之一是其综合使用多种数据、技术,有效提高算法精度,其二是建立开源的真值数据库,为验证算法准确性、可靠性提供有力参照。
技术方法可以参考现有的较为常规的做法,但不过过于迷信于此,需要多思考如果也照那样做会存在什么纰漏,是否能有更好的做法,在这样思考的过程中,不但能够提升结论可靠性,也是诞生新的研究idea
的契机。
手机信令价值密度低,需要进行数据清洗方能减少误差,降低冗余度,这能够提升结果准确性,也能大大减轻数据处理所花费的计算资源及时间。蔡教授团队设计一种层次化数据清洗流程
,可以提炼有价值数据,同时实现数据预处理工具可复用性。整个处理流程包含以下步骤:
经过预处理后,数据量减少了92%左右。
停留点是出行链节点,传统的停留点识别算法需要凭借研究者经验手动设定固定的时间阈值、空间阈值,存在较大主观性,蔡教授团队提出一种基于时空密度聚类的停留点识别算法
,以地面二维平面及时间维构架出时空三维坐标系,对出行数据中的时间和空间特征进行了整合,结合个体出行轨迹特征设置初始代价,不再设施固定时空阈值。
传统职住地分析需要人工定义职住时间段, 比如认为凌晨00:00-6:00是居家休息时间段,这种筛选方法大多数情况下有效,对于一些特殊工作模式如昼夜颠倒、无固定职住则不够准确。
蔡教授团队提出的职住地分析方法流程如下:
活动强度信息熵
指标来衡量分析用户活动强度如何判别用户出行选用何种交通方式,蔡教授团队提出一种基于时空关联匹配的出行方式识别方法
,该方法通过关联分析手机信令轨迹数据及高德地图导航数据,量化信令轨迹与各类导航路径相关强度,判别用户出行方式。具体流程如下:
蔡教授表示,该方法在长距离通行情况匹配结果较好,短距离通行受限于手机信令数据空间分辨率低结果不是特别准确。由于该方法需要大量导航数据,团队是通过申请多个企业号的方式解决。
在找出与用户信令轨迹最为匹配的导航路线基础上,采用中文分词
算法对路线信息做切分,得出个人出行画像,主要包含了主要出行方式、活动热点区域、公交线路等。
为啥要划份交通小区:
基础空间单元
。蔡教授团队提出基于多源数据的交通小区划分方法
:
对公交评价体系重新做了思考,将国标中的一些指标替换成新数据环境下更加准确、人性化的指标。
高级!!!
一个特别酷炫的应用场景:只需要在道路卡口拍一辆车的车牌,就能分析出车上坐了哪些人,即使后排乘客没有露脸。
蔡教授团队应用道路卡口数据描绘车辆轨迹,将信令轨迹与车辆轨迹做匹配分析,分析出车辆乘坐人员情况。所应用的算法为时空滑动窗口匹配算法,算法的具体步骤为:
匹配结果不是特别理想,但有初步结果:
算法准确性验证是算法开发中非常有必要进行的步骤,它能测算算法性能和有效性。
手机信令数据最大优点是全时空跟随性,缺点在于以基站位置代替实际位置会造成较大误差,为了能够验证算法准确度,蔡教授团队开发数据采集APP,以GPS数据作为真值数据,记录用户出行方式、停留状态、职住状态等。
蔡教授表示,目前该APP主要是团队内学生使用,出行方式单一,轨迹数据较少,考虑将此APP开源,以建立信令数据验证数据库,搜集更多的真值数据。
5G网络的频率要比4G网络快得很多,但是频率越大的基站,它的衰减就会越快,为此基站的密度就要比原来的密。目前为止三大运营商都已经做出了自己的大体部署,联通家的基站密度大概是原来的3到4倍,移动家的达到了六倍左右,电信家的也是三倍以上。
随着5G时代到来,更高覆盖密度的基站也意味着信令数据空间分辨率将大大提高,这对基于信令数据的交通研究是个极大的利好消息,这是个很有前景的研究领域。
赞
踩
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。