Cube增量处理

Cube增量处理

0
投票
1
已解决
3300
浏览
0
推荐
2531
浏览

BI笔记之---Cube增量处理的一个场景的处理方案

增量处理概述:通常来说Cube会随着时间的积累而日渐增长,这样一来如果每次都是全量处理的话会导致处理时间逐渐变长。所以对于大规模的 Cube,为了追求处理时间和性能,都会采取增量处理的方案。 场景:根据...

哥本哈士奇 发表了文章 • 2015-10-04 16:50

0
投票
2
回答
3795
浏览

CUBE增量处理疑问

天涯0403 回复了问题 • 2015-04-23 21:22
条新动态, 点击查看
首先给你的Fact建立分区体系,每次增量的Process你的Cube.
然后确保你的Dimension量不要超过50W, 否则Process会很慢。 如果超过了,就要考虑是不是设计问题
其次是你的计算量值,Distinct Count的计算尽量要少
最后处理索... 显示全部 »
首先给你的Fact建立分区体系,每次增量的Process你的Cube.
然后确保你的Dimension量不要超过50W, 否则Process会很慢。 如果超过了,就要考虑是不是设计问题
其次是你的计算量值,Distinct Count的计算尽量要少
最后处理索引这个不需要太频繁
可以的,最好是Fact做分区 然后只Process Add。 维度的可以。
可以的,最好是Fact做分区 然后只Process Add。 维度的可以。
你可以在PACKAGE层面,再收集一些LOG,查看下更多的详细的信息。
 
如果是大部分数据抽取是成功的,只是偶尔数据抽取失败了。那你要更多的分析下你的源数据服务器和目标数据服务器之间的网络连接。。。
 
我之前遇到这样相似的问题是由于网络不稳定,源数据库存储... 显示全部 »
你可以在PACKAGE层面,再收集一些LOG,查看下更多的详细的信息。
 
如果是大部分数据抽取是成功的,只是偶尔数据抽取失败了。那你要更多的分析下你的源数据服务器和目标数据服务器之间的网络连接。。。
 
我之前遇到这样相似的问题是由于网络不稳定,源数据库存储在IDC机房,目标数据库存储在公司内网,之间只有20M的带宽。一到晚上数据抽取的时候,遇到两个问题:
1. 数据抽取时间较长。
2. 网络不稳定,经常随机出现管道引擎调用错误。
 
后面的解决方案是,用Oracle主从进行数据同步到公司内网。数据抽取从公司内网从机抽取,根本上解决了上面两个问题。。。
 
楼主针对自身的生产环境,好好分析下。或者有必要,把信息描述的更清楚一些。
 
0
推荐
2531
浏览

BI笔记之---Cube增量处理的一个场景的处理方案

增量处理概述:通常来说Cube会随着时间的积累而日渐增长,这样一来如果每次都是全量处理的话会导致处理时间逐渐变长。所以对于大规模的 Cube,为了追求处理时间和性能,都会采取增量处理的方案。 场景:根据...

哥本哈士奇 发表了文章 • 2015-10-04 16:50