赞
踩
创建原始表和初步的拉链表后,到15号开始统计14号的数据,又有两条记录,入下图所示。因为我们每天产生的记录都会按照日期将数据保存在分区表中,所以该分区表最后多了一列表示分区名,其实就是日期。
更新原始表如下图所示,我们发现在14号的记录中,2号订单在14号被修改过一次,同时又创建了一个6号订单
然后我们需要将14号数据的分区表和初步设计的拉链表开始整合,进行左外连接(left join),拉链表left join 分区表,连接后的表里面end_time字段为null的值重新设置为永久生效日期。
为什么要这样设置呢?
(1)首先进行左外链接,结果是只有2号订单能够和拉链表匹配的上,说明只有2号订单在14号发生了更新,那我们就将拉链表中的2号订单的end_time改成14号,而其他4个订单的end_time会为null,说明没有发生更新,那我们就将其设置为永久生效日期。
(2)我们还发现在14日的数据中除了修改2号订单,又创建了一个6号订单,所以在拉链表中我们在最后直接加入一个6号订单。
最终将14号的记录更新后,拉链表如下图所示。
依此类推,我们开始收集15号的记录数据,导入分区表中,如下图所示。发现2号订单又更新了一次,4号订单也更新了一次,同时又创建了一个7号订单。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。