Kettle调度更新!比pan和kitchen效率快N倍,支持高并发!

浏览: 4095

“我在spoon里面运行一个作业只要几秒种,但是在TASKCTL中运行却要好几十秒?”

“并行同时运行几个job,就把内存撑爆了,TASKCTL好占资源呀!”


TASKCTL中调用kettle作业,实际上是通过pan和kitchen命令去调用。每一次调用都会重新初始化kettle运行环境,这个过程占用大量的时间。并且每启动一个kettle运行环境都相当于启动一个JVM进程。每个JVM则会占用几百兆(默认设置)的内存。所以同时运行几个作业,也会消耗大量内存资源。极端情况则可能会导致kettle内存溢出,产生致命错误。

       这次更新,采用直接调用kettle核心的方式来运行作业。使得调度效率大幅提高,消耗资源(不包含作业本身所耗资源)也大幅降低。并行执行多个作业也能轻松应对了。

一、安装部署:

1.      确保安装环境具备kettle程序目录

2.      下载好插件安装包taskctl-plugin-kettle.zip并解压至自定义安装目录

3.      进入安装目录,执行install命令。请注意windows环境需要以管理员身份运行。

4.    按照install程序的提示,确定kettle安装目录和IP及端口和资源库等信息。

QQ图片20171027163754.png

5.      安装完毕后会生成cprunsoapkjb.sh (调作业)和cprunsoapktr.sh(调转换) 脚本,根据提示分别放到TASKCTL的插件目录下。

6.      执行startup命令启动插件服务,安装完毕!

二、使用教程:

1.      在桌面软件Admin中配置好kettle插件,如下图所示:

blob.png

2.      通过Designer设计kettle调度流程如下代码:

        
<ktrjob>
<name>ktr2</name>
<progname>$HOME/mykettle/myktr.ktr</progname>
<para>filename=output,line=$(msystime)</para>
<jobdesc>核心调转换很快</jobdesc>
</ktrjob>
<kjbjob>
<name>kjb5</name>
<progname>$HOME/mykettle/mykjb.kjb</progname>
<para>filename=output,line=$(msystime)</para>
<jobdesc>Linux文件系统</jobdesc>
</kjbjob>

3.      把示例mykettle.zip解压拷贝至插件安装环境下的 mykettle/目录(window环境请放至d:\mykettle):

4.      编译流程后运行作业。可观察到在mykettle目录下,kettle作业生产的输出文件。

三、常见问题及解答:

       Q:可以调kettle资源库的作业吗?

       A:支持数据库资源库和文件型资源库。在插件安装过程中选择资源库类型DB(数据库资源库)或FILE(文件资源库)根据提示进行安装。

 

       Q:调用windows平台的kettle作业,还需要安装TASKCTL的windows代理端吗?

       A:不需要。该插件采用SOAP协议访问。只需要在windows环境安装该插件即可。

 

       Q:提示“Can not Access the http://xxx.xxx.xxx.xxx:xxxx/ SoapAPIService”

       A:需要执行startup命令启动插件服务,或检查8099(默认)端口是否打开。

 

       Q:怎么传递参数给作业?

       A:按照”para1=value2,para2=value2”的形式。需要在作业中预设好命名参数para1和para2。

 

       Q:怎么调整作业的日志输出等级?

       A:在插件的conf目录下,配置ctlconf.int文件。设置PLUGIN.KETTLE.LOGLEVEL=[kettle日志等级],并重新启动插件

       Q:支持kettle哪些版本?

       A:该插件在kettle 7.0上测试通过。理论上也支持其它kettle版本。

 

       Q:插件日志保存多久?

       A:30天

推荐 2
本文由 taskctl 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册