你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
没有找到相关结果
BAO胖子 - 15年BI经验,涉足电力,快消品,医药,信息服务等行业的BI老兵。 2015-09-01 回答
赞同来自: 梁勇 、biee新手 、redwoodschu
牟瑞 - 大数据 Hadoop 讲师 Hadoop入门课程地址:http://www.hellobi.com/course/39 有架构师,技术总监,CTO的职位请联系我! 2015-08-27 回答
赞同来自: biee新手
子建 - Kettle讲师、顾问、数据仓库架构 2015-08-18 回答
赞同来自:
要回复问题请先登录或注册
新手求带
推荐一份编程学习资源,包含了各类编程语言学习进阶路线图、视频教程、配套书籍文档、数百份面经,各大厂面试真题。编程语言包括:Java、前端、PHP、Python、Linux运维、软件测试、数据解构与算法、C语言、go语言等
微信扫码关注公众号,发送 "编程"获取资源
3 个回复
BAO胖子 - 15年BI经验,涉足电力,快消品,医药,信息服务等行业的BI老兵。 2015-09-01 回答
赞同来自: 梁勇 、biee新手 、redwoodschu
1. 源系统相关表建触发器,但这个一般不太现实,不过不管怎样也是一种解决方案
2. 用change data capture这类软件去源系统捕获日志,但这种软件要花钱购买而且价格不菲,此外还是需要安装在源系统上,很多系统管理员会非常不爽这种事情。且,源系统的数据变化要走日志,如果不走归档日志或者用truncate以及load加载数据关闭日志的模式,你还是无法捕获到这些数据
3. 全表比对。这个不要害怕,如果上游系统的数据量低于10W,全表比对没有你想象的那么性能低下。这里面有个tips,就是用checksum code,这种类似CRC码的模式对源表多Column进行预先计算,而在目标表中也添加此column,而全表比对时只需要比对主键以及checksum code, 10W行数据的话速度也是可以接受的。全表比对在Datastage中有CDC的控件可以帮助你完成,非常简单,我猜kettle也有类似的东西,如果没有就SQL outer join,也不复杂。
牟瑞 - 大数据 Hadoop 讲师 Hadoop入门课程地址:http://www.hellobi.com/course/39 有架构师,技术总监,CTO的职位请联系我! 2015-08-27 回答
赞同来自: biee新手
SQLServer有CDC,MySQL可以监控bin log.然后通过处理监控到的数据日志表来避免全表扫描,加快处理速度。
子建 - Kettle讲师、顾问、数据仓库架构 2015-08-18 回答
赞同来自: