目前完全为kettle定制的调度平台 (免费的)目前是没有的 ,(据我所知,商业版的pentaho完整的bi解决方案里面是有调度平台的,那个调度平台不在kettle里面,而在另外的一个bi服务器里面,所以调度平台是很重要的,起码官方知道有这个必要性)
而我提到的这些这工具都是随着hadoop和软件开发里面的自动部署发展而来,天生带有执行shell\bat的功能 所以间接的能用于kettle的kitchen\pan的bat调度,而不在需要win的工作计划linux的cron.(这个也是我的帖子主体为什么会用“间接构建”这样的标题来描述)
关于Jenkins的介绍我就不说了,自己百度,因为这个工具调用脚本只是他的功能的冰山一角,其他功能我也不能理解,因为不是那个领域。
下面我就介绍一下为什么我们需要一个调度平台,以及学习完jenkins后,能解决什么问题。然后在开始讲解安装部署,然后再讲一下怎么调用kettle作业(和处理作业依赖)
1.为什么我们需要调度平台?
2.答:可能大部分人对于kettle的调度还是停留在win的计划任务,linux的cron, 但是作业越来越多,作业之间相互依赖,(例如:A作业,b作业,执行完之后,才能执行c作业),这些简单的通过计划任务是完成不了的,或许有些人说,可以把这三个作业放在kettle的一个作业里面表示其内的依赖关系,那么这样做,就会把本来模块化的作业塞到一个臃肿的作业里面,作业之间高度耦合,一个很大的作业还可能会存在kettle内存消耗过大的问题内存溢出的问题,以致难以管理。
2.学习完jenkins后,能解决什么问题?
答:集中管理作业/转换的调度,以及每次调度的日志保存,处理作业调度依赖性问题等(因为目前我也是小白,也刚刚接触到这个东西,我只是想把我知道的东西分享给大家,所以会讲的比较简单,但是个人觉得jenkins能做的东西应该还有很多,例如分布式的调度系统)
后续的部署使用就放到附件中了