Kettle (二)——第一个JOB设计及其调用

浏览: 1676
ETL

 Kettle是个好工具,他的开源性以及免安装性决定其用起来的方便。在这篇文章当中不细说ETL过多的理论,直接上手。 第一次编写Kettle小JOb,首先要说一说编写JOB的步骤:

  需求如下:

    

ž说明:

ž源表:数据库etltest中存在3张表:

目标表:etltest中一张表

  1:如上的一个需求,Mapping关系已经很明显。

  2:打开Kettle工具,点击新建,先新建一个transformation 并保存。保存后缀名为.ktr文件

 3:设计如下图:

 

  此时的transformation 已经全部设计完成,并将数据落地为flat file 文件(具体落地到表的未操作)

 

  下一步需要解决在服务器运行问题,以及如何重复的在某个时间点调用的问题。

   实现这个方式可以通过两种方式,一种是Kettle自带的job实现。另一种是编写shell 脚本。

   第一种情况,Kettle自带的通过配置相应的参数即可实现,此出不再详细叙述。

  第二种情况,需要先介绍下相关概念。

      Kettle有两个Bat 包,一个Kitchen.bat,一个span.bat .

      Kitchen——工作(job)执行器 (命令行方式)
      Span——转换(trasform)执行器 (命令行方式)

 

这里我们重点讲一下 Kitchen.bat作业执行器 ,这个是经常要用到的。

推荐 0
本文由 doudou1 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册