赞
踩
最近一直在忙毕业的事情,比赛也落下不少。今天第一次切换了数据,在此对之前的工作做个简单的总结。感谢组委会岱月邀请我写自己的参赛经历,《天池小白成长记》在阿里的“天池大数据科研平台”上发布了,还是蛮激动的。好啦,进入正题!
在论坛和QQ群里看到有部分同学透露自己的方法,我就顺道记下来啦,注:以下成绩均为6月7日切换数据前的成绩,评分时间大概在6月1日到6日之间
1、RNN(递归神经网络)
有位大神用RNN预测,不过收敛比较严重,加入了星期特征,成绩约6200。
这应该是一周前的成绩了,现在不知道怎么样了。喜欢神经网络的同学可以试试。
2、GBDT
有人放了星期、节假日、三日均值等特征,得分6350。
这个算法复赛平台里有,所以初赛复赛可以较好地衔接。
3、ARIMA
有几个人直接用的auto.arima,不过得分大不同。有人得分6200、6300,有人得分6455。有一个得分6459的同学给的提示是:用你能想到的一切的方法去切割数据集。不止50个数据集,还要对歌手近一步切割。
时序算法复赛平台里目前没有。
4、Random forest
有人得分得分6444,有人6483,也有人改进后提升到6518。
这个算法复赛平台里有。
5、小波包分解
有人对每天的播放人数进行小波分解(直接调python包),分解3层以上,周期感觉很明显。按照艺人每天不同的播放人数,把趋势分解出来,剩下的是随机波动,有很明显的周期,7天左右。
我猜测该同学是信号处理专业的,有兴趣同学也可以试试傅里叶变换等信号处理算法,有可能独辟蹊径。
<
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。