当前位置:   article > 正文

时间序列型的数据做预测_决策树模型可以加入时间吗

决策树模型可以加入时间吗

        

        最近在公司有做一个  快递中转中心<--->另一个快递操作中心  操作量预测的项目,有一些方法和感想总结一下

一、问题背景

1、主要目的是为了预测T+7日内快递某操作中心到其他操作中心的发件量,即中心的操作量

2、T+1日的预测精度高对实际工作帮助较大

二、主要思路

1、做仿真系统,把实际影响的因素都考虑进去,读快递网点实时的收件数据,然后和快递中心的人、车等影响因素相匹配,得到近乎实际的预测数据,这个需要大数据的流处理,比如storm,streaming

2、传统机器学习方式做预测,回归、决策树、时间序列

3、经验参数型,学习周期变化(周、季节、电商活动周期等)的参数,然后预测

4、深度学习系列,LSTM

三、 实际处理

我和小组内的另一个小伙伴一起做,源数据就是时间序列型的,某中心-->某中心,日期,操作量 这样格式

我主要用回归,决策树,经验参数,最后LSTM水了一下,完全不懂这个

另一个小伙伴主要用时间序列,主要用ARIMA这个模型

经验参数这个效果相对最好,主要思路:

1、观察数据,周之间的规律性较强,一个中心到另一个中心每周二相对周一的日环比大小相当

2、快递公司操作量很受电商活动的影响,电商影响的日期做平均处理,实际上线时单独处理

3、这样先预测一天的结果    某周二预测操作量=sum(之前x周的周二的操作量)/sum(之前x周的周一的操作量)*周一的操作量

4、然后同样求周三到周二变化率,周四到周三的变化率,累乘

5、然后就是具体调参数,用几周的平均值,还是随意给系数,这个可以根据误差率计算一个最优的参数

四、结果比较

经验参数结果更稳定且误差最小,最后上线采用的这个

五、总结

1、底层数据完善可以节省很多清洗数据的时间

2、特征工程很重要,做的时候只是简单的数据整理就跑模型,现在想特征工作认真做一下应该会有不小的提升

3、如果是线上的模型,最好开始做的时候就能在线上部分实现,这样很多想法能更快的尝试

4、机器学习的路还有很长要走,特征工程完全是凭感觉在做,没有一个系统的方法,希望能有机会去大厂工作学习下

最近有看到一篇文章写得蛮全面的,可以参考下:http://www.infoq.com/cn/articles/a-study-on-sales-forecasting-based-on-machine-learning/

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/700155
推荐阅读
相关标签
  

闽ICP备14008679号