当前位置:   article > 正文

记广东公共交通大数据竞赛—— 公交线路客流预测

记广东公共交通大数据竞赛—— 公交线路客流预测

——最终准确率 76.99%
——排名 83/2734
——代码: https://github.com/francis7999/gd_line_pop_predict

最后的成绩有欣慰也有不足,第一次参赛的我本该满足于前5%的排名,但想到参赛期间有一大半的天数都为其他的事情焦头烂额,没有做任何改进,总是不由感慨本可以取得更好的成绩。

力学出身的我,此前从未想到研究生会去做语音识别方向。
人生是多么不可思议,我的本科专业和研究生方向找不出一丝一毫联系。前途茫茫,而我披星戴月,风雨兼程。
要做语音识别,必然深钻机器学习,而我浅薄的学习之下也只掌握了一些皮毛,但学到了理论,那就要熟练运用,脱离实际的理论无异于空中楼阁。
于是参加了阿里的广东公共交通大数据竞赛——公交线路客流预测。作为机器学习与数据挖掘领域的新手,第一次参加大数据竞赛,我抱着学习的想法,目的就是运用一些学到的机器学习知识解决一点实际问题,顺便巩固基础。

工具:python 2.7 + scikit-learn

步骤:
1. 数据预处理。统计了训练集中每天每个时段的客流量,排除了一些客流过少,显然统计错误的样本。处理了天气数据,把(时段、天气、最低温、最高温、风力)作为特征,客流量作为预测变量。
2. 上模型。根据两条线路、工作日和节假日,分别建立四个模型。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/796504
推荐阅读
相关标签
  

闽ICP备14008679号