ETL

问个简单的问题,是不是数据采集都是由datastage来主动完成的,原来的各系统不用做任何修改与调整

0
已邀请:
1

simon_cao - 打酱油 2016-03-29 回答

Datastage是ETL工具,无法主动完成数据采集。既然是工具那么DS的主要意义就在于:抽取(Extract),转换(Transform),加载(Load)。所以你提到的数据采集我们就可以认为是数据的抽取过程,那么DS是如何采集数据的呢,这里就要提到被动触发机制,DS作业可以添加计划(schedule),即何时执行作业,也可以通过脚本或者调度工具来调度(如,Tivoli,control-M等)。
同时提到数据采集,那么可能涉及的网站数据收集,可以采用网络爬虫来收集。如果对于关系型数据库数据采集,可以考虑使用CDC,来通过捕捉日志变化的方式来收集数据。
 
0

子建 - Kettle讲师、顾问、数据仓库架构 2016-03-29 回答

DS是数据处理工具 可以说跟采集没关系

要回复问题请先登录注册