两台库都不在本地区,我在本地使用kettle在两库之前导数,需要经过我本地么?如何能提升性能?把kettle部署在哪里?

0
已邀请:
2

牟瑞 - 大数据 Hadoop 讲师 Hadoop入门课程地址:http://www.hellobi.com/course/39 有架构师,技术总监,CTO的职位请联系我! 2015-08-28 回答

部署在什么地方,这个需要考虑很多的因素:比如网络。带宽,服务器性能等。提供思路,仅供参考:
1.部署在带宽比较大的地方,如果Kettle需要通过网络连接处理数据,那么网络带宽大的话,数据传输就会快。
2.部署在与数据库频繁交互的服务器,这样可以减少与数据库交互的网络带宽请求。
3.部署在性能比较好的服务器。性能好处理速度才会快。
至于提升性能的话,这种也要具体问题具体分析了,比如查询性能,批量插入数据等。理想的状态是,两个数据库的服务器都计算好相关的数据,然后通过kettle来做调度。
0

子建 - Kettle讲师、顾问、数据仓库架构 2015-08-28 回答

2库都不在本地就不需要经过你本地了,直接2库调用
0

bomb0201 2015-08-28 回答

如果kettle程序部署在本地,那必然要经过本地,所以比较好的方法是部署在源或者目标库所在的环境中

要回复问题请先登录注册