Kettle手册(一)- 序及Kettle简介

浏览: 14419

1. 序

    好久没有写博客了,新的一年总得留下点儿什么。目前主要负责数据仓库这一块任务,平时用用Kettle、SSIS这类ETL工具,而且工具的使用整理起来会方便些。所以先从Kettle开始,一点点整理下最近BI开发中掌握的知识。

    以前有做过BI报表Cognos开发还有些入门级的Java,都在CSDN博客上,感兴趣的同学可以去看看:于贵洋的博客

20170327_1.PNG

好了,下面就根据自己的经验和理解,整理下Kettle的知识。

2. Kettle简介

    Kettle这东西是干嘛的呢?

    Kettle是一个开源的ETL工具,所以基本的数据抽取、转换、加载,他都可以。

    比如:我要把一个mysql数据库的数据同步到一个Postgres数据库,我们有哪些办法呢?

大概会有,

    1.将数据导出为文本文件,使用PG的copy命令直接加载

    2.数据量少的话,直接拼接成insert脚本,批量插入

    3.一些开源的小工具,提供2种数据库直接的同步

    4.Kettle

    等等方法

    再比如:我每天需要统计一些系统中的异常数据,导出为Excel,用邮件发送给指定的开发人员处理,该怎样做呢?

    1. Java或者其他开发语言做定时任务

    2. Kettle   

    和其他的ETL工具相比,他有什么优势呢?

    Kettle是基于Java开发的,是开源免费的,大家可以直接在网上下载;跨平台,Windows,Linux都可以使用;使用起来简单快捷。

    既然开源,相比于其他收费产品,劣势也就很显然了,比如稳定性啊,BUG修复处理啊,而且基于Java,性能上会差些。当然都是相对来说,一般数据量使用或者逻辑不复杂的话,使用起来是很适合的。

    刚刚也在社区上,发现了Kettle的视频,kettle视频,大家可以看看,应该用的到。

Kettle的基本介绍就这些,后面会根据实际的例子,来介绍下Kettle的使用。

推荐 8
本文由 liutangwow 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

1 个评论

兄弟你好,我最近也在学kettle,你有神马学习资料么?

要回复文章请先登录注册