DataStage 配置CDC 实现数据实时处理

浏览: 2512

版本:IBM InfoSphere DataStage V11.3.1

操作系统:linux redhat 6.4

数据库:Oracle 11.2.0.4.0


前言:之前和IBM同事参与CDC和Datastage结合,打造数据实时性。虽然最后可以满足数据时效性,但是代价也是相对的,24小时不停的监控,这样也是耗性能的。

          也不由得感慨,想象是完美的,现实却是未必。这个笔记由同事记录,分享下。



1.4.1具体步骤

1.首先需要安装CDC_for_Datastage,创建相应的实例并启动实例为运行状态。

2.创建数据存储器并分配用户,搭建预定。

3.用CDC导出相应的dsx文件,详细步骤如下。

1).右键搭建好的预定

>>【Infospheredatastage】>>【Infosphere datastage属性】,如下图,红框中【项目】填datastage的工程名,连接建自己定义一个名字。然后确定Clipboard Image.png


2). 右键搭建好的预定>>【Infospheredatastage】>>【生成Infosphere datastage作业定义…】,

选择保存路径,以便导入datastage。


3.导入作业

把MID1_TEST.dsx文件导入Datastage中。如下图所示

Clipboard Image.png


4.去掉DB2_Connector控件

换成oracle控件,如果目标端数据是DB2可以不用换。BooKmark是记录数据读取的一个标签,该记录会被写入到目标表BooKmark_table表中,该表是在安装CDC_FOR_datastage创建实例时创建的表。把改job拆分如下:

Clipboard Image.png


5.双击CDC_Transaction控件,按下图配置数据库连接信息

Clipboard Image.png


6.双击Oracle_Connector_10控件,按下图填写配置信息

Clipboard Image.png


7.双击Copy_11控件 按下图填写信息。

Clipboard Image.png

8.双击Oracle_Connector_33控件,按下图填写信息

Clipboard Image.png

推荐 0
本文由 我是最优雅的杀手,不杀人专杀狗 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册