赞
踩
规则的好处是简单高效且可解释性强,有时候样本量不足时,使用有用的规则比建模更有效,面对问题的时候不能只想着建模,而是根据问题去寻找解决的方案有哪些,互相比较,找到最好的解决方案
周期通常有一周、一月、一年,支付行为、客流量、交通数据等时间序列都具有明显的周期性,缺点是不考虑特定日子和节假日。
若以周为周期,则如何计算周期因子?
第一种方式:除以周均值,然后按列取中位数
第二种方式:先获得列的均值(周内每日),再除以整体均值(整体均值就是所有值的平均值)
第二步就是预测,得到周期因子,就可以预测第四周的客流量,使用第一种方式,中位数直接乘以base,这里的base使用了第三周的均值。
base除了用最后一周的均值,我们可以使用去周期后取平均,即直接用第三周的原始客流量直接去除以中位数,中位数可以一定程度代表算数平均数。
train = data[(data['date']>=datetime.datetime(2014,3,31))&(data['date']<=datetime.datetime(2014,8,3))] test = data[(data['date']>datetime.datetime(2014,8,3))&(data['date']<=datetime.datetime(2014,8,31))] pred = pd.DataFrame(columns=['date','purchase','redeem']) s = [] for i in range(4,32): a = datetime.datetime(2014,8,i) s.append(a) pred['date'] = s train.reset_index(inplace=True) test.reset_index(inplace=True) del train['index'] del test['index'] pred['purchase'] = test['total_purchase_amt'] pred['redeem'] = test['total_redeem_amt'] pred['date'] = pd.to_datetime(pred['date'
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。