当前位置:   article > 正文

kettle安装步骤及使用实例_pdi-ce-8.3.0.0-371

pdi-ce-8.3.0.0-371

概述

  • Kettle 是 PDI 以前的名称,PDI 的全称是Pentaho Data Integeration,Kettle
    本意是水壶的意思,表达了数据流的含义。
  • Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。
  • Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。
  • Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

安装

1.资源包(需要依赖jdk8环境)

链接:https://pan.baidu.com/s/1II8xKtvHrxY4aNQ4y4T_QA
提取码:4zzc

2.找到D:\software\pdi-ce-8.3.0.0-371\data-integration下的Spoon.bat生成桌面快捷方式并加一个图标
点击图标右键打开选择属性-更改图标-浏览选择spoon.ico文件即可
在这里插入图片描述

3.连接mysql数据库,把驱动包mysql-connector-java-5.1.39.jar放在安装目录下的D:\software\pdi-ce-8.3.0.0-371\data-integration\lib下面即可

链接:https://pan.baidu.com/s/1II8xKtvHrxY4aNQ4y4T_QA
提取码:4zzc

3.要连接oracle数据库,把相关的数据库驱动包放在lib下即可

链接:https://pan.baidu.com/s/1II8xKtvHrxY4aNQ4y4T_QA
提取码:4zzc

使用简介

  1. 转换是ETL解决方案中最主要的部分,它负责处理抽取、转换、加载各阶段对数据行的各种操作。 转换包括一个或多个步骤,如读取文件、过滤输
    出行、数据清洗或将数据加载到数据库。
  2. 转换里的步骤通过跳来连接,跳定义了一个单向通道,允许数据从一个步 骤向另一个步骤流动。
    在Kettle里,数据的单位是行,数据流就是数据行从一个步骤到另一个步骤的移动。
  3. 除了步骤和跳,转换还包括了注释,注释是一个小的文本框,可以放在转 换流程图的任何位置。注释的主要目的是使转换文档化。

使用实例

表数据导出excel

输入->表输入
1.选择表输入,双击表输入进行编辑配置
2.新建数据库连接
在这里插入图片描述
3.如果连接报错,可以在选项中设置参数
在这里插入图片描述
4.获取sql查询语句,可以直接预览数据库中的表
记录数量限制可以设置要处理的数据行

输出->excel输出
1.选中表输入,按住shift,连接到excel导出
2.文件->选择要导出的位置
字段,编辑要导出的字段
3.点击运行这个转换

oracle导出到mysql
1.输入->表输入,新建oracle数据库连接
在这里插入图片描述
2.输出->表输出,新建mysql数据库连接
选择数据库,目标表,指定数据库字段,输入字段映射
在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/582428
推荐阅读
相关标签
  

闽ICP备14008679号