赞
踩
Kettle里有不同的工具,用于ETL的不同阶段。主要工具如下:
是转换里的基本的组成部分。
跳的这种基于行集缓存的规则允许每个步骤都是由一个独立的线程运行,这样并发程度最高。这一规则也允许数据以最小消耗内存的数据流的方式来处理。在数据仓库里,我们经常要处理大量数据,所以这种并发低消耗内存的方式也是ETL工具的核心需求。
对于kettle的转换,不可能定义一个执行顺序,因为所有步骤都以并发方式执行
1. 当转换启动后,所有步骤都同时启动,从它们的输入跳中读取数据,并把处理过的数据写到输入跳,直到输入跳里不再有数据,就中止步骤的运行。
2. 当所有的步骤都中止了,整个转换就中止了。(要与数据流向区分开)
如果你想要一个任务沿着指定的顺序执行,那么就要使用"作业"
http://www.kettle.org.cn/
https://www.dandelioncloud.cn/article/details/1487597814917222401
https://so.csdn.net/so/search?q=kettle%20&t=blog&u=qqfo24
https://blog.51cto.com/search/user?uid=3549599&q=kettle&page=2
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。