DataStage总结_datastage lookup和join优先选哪个

作者：爱喝兽奶帝天荒 | 2024-06-25 09:22:17

踩

datastage lookup和join优先选哪个

lookup和join的区别

lookup属于重量级的，它将数据读入内存中，所以效率很高，但会占用很大的物理内存。Join属于轻量级的，所以当reference data 比较小的时候用lookup,比较大的时候用joinm.

BIEE需要启动的服务:Java host、server、presentation server。

datastage中job activity的主要选项:、other wise、filed waring、user status、customer

自动job的流程:在datastaget选择toolàrun directoràschedule再选择需要要设置的JOB，右键Add to scheduleàrun job进行设置

设置默认字符集:administ ratoràprojectànlsàserver maps中选择

datastage通过routine调用存储函数:routine

datastage中的变量:系统变量，用于系统个属性的设置。用户自定义变量。系统函数routine。

自动连接mapping中的控件:autolink、autolink by name、autolink by position。

powercenter cache大小的计算:记录数乘以每一个记录数相关字段的字节数。

powercenter控件分为两种类型:主动：记录数和数量会发生改变。被动：记录数和数量不会发生改变。

powercenter通过ODBC与数据连接:ODBC

task分为可用性和不可用性。

infomatica日志文件和运行统计信息:

性:

infomatica如何调用存储过程:

infomatica性能调优:主要有流程调优、单项作业调优。

存储过程赋予其它用户：grant execute on test_proc to user;

Infomatica客户端包含的组件：PowerCenter Designer、Repository Manager、workflow Manager、workflow Monitor

Datastage客户端包含的组件：DataStage Administrator、DataStage Designer、DataStage Director、DataStage Manager

7.在编写PL/SQL代码中使用SELECT语句时如何避免例外发生:

在使用SELECT语句为某变量赋值时，往往会出现"NO_DATA_FOUND"和"TOO_MANY_ROWS"等异常情况。

使用SELECT语句分两种情况：

第一种情况，判断某表中是否有符合某一条件的记录，这时使用聚组函数MAX就可以避免以上两个例外的发生。

其格式：SELECTMAX（列1），MAX（列2）......INTO变量1，变量2......FROM基表WHERE条件，当没有符合条件的数据时，该语句返回空，即变量1，变量2......的值均为空，而不会出现"NO_DATA_FOUND"例外。

另外使用聚组函数MAX的同时也就避免了"TOO_MANY_ROWS"例外。

第二种情况，SELECT语句中含聚组函数SUM，这时如果使用了GROUPBY和HAVING子句，当没有符合条件的记录时将发生"NO_DATA_FOUND"例外，此时避免例外的办法是：去掉GROUPBY和HAVING子句，将HAVING子句的条件加到WHERE子句中。这样在使用SELECT语句时就不必再额外增加一段处理例外的代码，从而简化的代码的编写。

另外使用SQL%NOTFOUND也是一种比较好的方式。

常用的增量抽取方法有哪些？每种方法都有些什么样的问题?

1. 时间戳

2. 数据快照

3. 日志表文件

4. 增量文件

5. 业务逻辑

Datastage如何调用Oracle存储过程

可以选择编写一个自定义Routine然后通过Transformer去实现，或者建立存储过程，然后在Database组件里的Before After里用数据库语句去调用就可以了。还有一个选择就是运行自定的shell脚本去调用，这种方法要用到job sequence中的运行命令的组件

声明：本文内容由网友自发贡献，转载请注明出处：【wpsshop博客】