请问下SSAS建cube时,我应该怎样去划分cube才比较好?所有的事实表都会和日期维关联,好像做着做着感觉所有表都可以做成一个大cube,不知道实际应用中应该怎么去规划,性能和效率才比较高

0
   如标题所问到。因为总感觉好多事实表都可以关联在一起,就如微软示例中的批发客户的事实表和网购的事实表,用日期表来关联,然后他们的各自往外关联的客户维度表是各不一样的,一个是批发客户的,一个是网络零售客户。感觉在实际中,我也有这个困扰,总想把所有的事实表用日期来关联在一起,这样子做出来的cube好像就没完没了一样。
   我看我们乙方做的cube,他们好像需要考虑到性能方面的问题,同一个分析模型,倒做了好几个cube来防止性能差的问题,如同一个事实表与商品维度表关联,因为有些求商品款数用sku“款色码”来算,有些分析用“款”来算,我们乙方反而建了两个cube,同一个事实表关联不同的商品维度做成多个cube,可能因为discount效率比较低,统计款数时要用到去重计数,他们就建了多个cube出来。说是性能会好些。
已邀请:
0

天桥下的郑成功 - Hadoop大数据开发工程师、数仓架构师、熟悉数据仓库设计、Hadoop、Spark、HBase、Hive、SSIS等开发 2016-05-11 回答

这些都是需要经验去积累的。
可以多看看kimball这些人写的维度建模方面的书,然后再自己在工作中付诸于实践。
你说的discount效率比较低可能是因为其中涉及的运算比较多,比如用到了distinct这种操作。
而实际工作中,这些问题是可以使用一些折中的方式避免的

要回复问题请先登录注册