赞
踩
最近在公司有做一个 快递中转中心<--->另一个快递操作中心 操作量预测的项目,有一些方法和感想总结一下
一、问题背景
1、主要目的是为了预测T+7日内快递某操作中心到其他操作中心的发件量,即中心的操作量
2、T+1日的预测精度高对实际工作帮助较大
二、主要思路
1、做仿真系统,把实际影响的因素都考虑进去,读快递网点实时的收件数据,然后和快递中心的人、车等影响因素相匹配,得到近乎实际的预测数据,这个需要大数据的流处理,比如storm,streaming
2、传统机器学习方式做预测,回归、决策树、时间序列等
3、经验参数型,学习周期变化(周、季节、电商活动周期等)的参数,然后预测
4、深度学习系列,LSTM
三、 实际处理
我和小组内的另一个小伙伴一起做,源数据就是时间序列型的,某中心-->某中心,日期,操作量 这样格式
我主要用回归,决策树,经验参数,最后LSTM水了一下,完全不懂这个
另一个小伙伴主要用时间序列,主要用ARIMA这个模型
经验参数这个效果相对最好,主要思路:
1、观察数据,周之间的规律性较强,一个中心到另一个中心每周二相对周一的日环比大小相当
2、快递公司操作量很受电商活动的影响,电商影响的日期做平均处理,实际上线时单独处理
3、这样先预测一天的结果 某周二预测操作量=sum(之前x周的周二的操作量)/sum(之前x周的周一的操作量)*周一的操作量
4、然后同样求周三到周二变化率,周四到周三的变化率,累乘
5、然后就是具体调参数,用几周的平均值,还是随意给系数,这个可以根据误差率计算一个最优的参数
四、结果比较
经验参数结果更稳定且误差最小,最后上线采用的这个
五、总结
1、底层数据完善可以节省很多清洗数据的时间
2、特征工程很重要,做的时候只是简单的数据整理就跑模型,现在想特征工作认真做一下应该会有不小的提升
3、如果是线上的模型,最好开始做的时候就能在线上部分实现,这样很多想法能更快的尝试
4、机器学习的路还有很长要走,特征工程完全是凭感觉在做,没有一个系统的方法,希望能有机会去大厂工作学习下
最近有看到一篇文章写得蛮全面的,可以参考下:http://www.infoq.com/cn/articles/a-study-on-sales-forecasting-based-on-machine-learning/
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。