当前位置:   article > 正文

DataStage总结_datastage lookup和join优先选哪个

datastage lookup和join优先选哪个

lookupjoin的区别

lookup属于重量级的,它将数据读入内存中,所以效率很高,但会占用很大的物理内存。Join属于轻量级的,所以当reference data 比较小的时候用lookup,比较大的时候用joinm.

 

BIEE需要启动的服务:Java hostserverpresentation server

datastagejob activity的主要选项:other wisefiled waringuser statuscustomer

自动job的流程:datastaget选择toolàrun directoràschedule再选择需要要设置的JOB,右键Add to scheduleàrun job进行设置

设置默认字符集:administ ratoràprojectànlsàserver maps中选择

datastage通过routine调用存储函数:routine

datastage中的变量:系统变量,用于系统个属性的设置。用户自定义变量。系统函数routine

自动连接mapping中的控件:autolinkautolink by nameautolink by position

powercenter cache大小的计算:记录数乘以每一个记录数相关字段的字节数。

powercenter控件分为两种类型:主动:记录数和数量会发生改变。被动:记录数和数量不会发生改变。

powercenter通过ODBC与数据连接:ODBC

task分为可用性和不可用性。

infomatica日志文件和运行统计信息:

:

infomatica如何调用存储过程:

infomatica性能调优:主要有流程调优、单项作业调优。

存储过程赋予其它用户:grant execute on test_proc to user;

Infomatica客户端包含的组件:PowerCenter DesignerRepository Managerworkflow Managerworkflow Monitor

Datastage客户端包含的组件:DataStage AdministratorDataStage DesignerDataStage DirectorDataStage Manager

 

7.在编写PL/SQL代码中使用SELECT语句时如何避免例外发生:

在使用SELECT语句为某变量赋值时,往往会出现"NO_DATA_FOUND""TOO_MANY_ROWS"等异常情况。

使用SELECT语句分两种情况:

第一种情况,判断某表中是否有符合某一条件的记录,这时使用聚组函数MAX就可以避免以上两个例外的发生。

其格式:SELECTMAX(列1),MAX(列2......INTO变量1,变量2......FROM基表WHERE条件,当没有符合条件的数据时,该语句返回空,即变量1,变量2......的值均为空,而不会出现"NO_DATA_FOUND"例外。

另外使用聚组函数MAX的同时也就避免了"TOO_MANY_ROWS"例外。

第二种情况,SELECT语句中含聚组函数SUM,这时如果使用了GROUPBYHAVING子句,当没有符合条件的记录时将发生"NO_DATA_FOUND"例外,此时避免例外的办法是:去掉GROUPBYHAVING子句,将HAVING子句的条件加到WHERE子句中。这样在使用SELECT语句时就不必再额外增加一段处理例外的代码,从而简化的代码的编写。

另外使用SQL%NOTFOUND也是一种比较好的方式。

常用的增量抽取方法有哪些?每种方法都有些什么样的问题?

1.     时间戳

2.     数据快照

3.     日志表文件

4.     增量文件

5.     业务逻辑

Datastage如何调用Oracle存储过程

可以选择编写一个自定义Routine然后通过Transformer去实现,或者建立存储过程,然后在Database组件里的Before After里用数据库语句去调用就可以了。还有一个选择就是运行自定的shell脚本去调用,这种方法要用到job sequence中的运行命令的组件

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/爱喝兽奶帝天荒/article/detail/755797
推荐阅读
相关标签
  

闽ICP备14008679号