非重复计数的度量值组处理速度非常慢,怎么提高这个处理速度?

0
CUBE增量处理,处理当前分区,
有多个度量值组,排除其中两个非重复计数(统计款数,颜色数)的度量值组,其它的都是几秒就完成了,
就这两个,一个都要五分钟以上的时间,请问这个怎么改进,提高处理速度呢?

谢谢
已邀请:
0

天桥下的郑成功 - Hadoop大数据开发工程师、数仓架构师、熟悉数据仓库设计、Hadoop、Spark、HBase、Hive、SSIS等开发 2015-02-28 回答

非重复计数是要避免使用的一个聚合类型,如果数据量很大的话处理起来是非常慢的。
但是有些需求又是不可避免的,但是你可以从设计上workaround。
比如你在做 ETL的时候,完全可以自己设计一张表专门用来保存这个 款式的销售数量,或者 颜色的销售数量

要回复问题请先登录注册