2000W大数据量下Cube该如何设计,具体描述如下:

0
数据库里面存储了一个表A,数据量大约2000万条,里面有1,2,3,4,5,6,7,8个字段,需求如下:
1.根据字段1,查看每种2的个数,从大到小排序
2.根据字段1,3,查看每种2的个数,从大到小排序
3.根据字段1,3,统计每天的个数
4.根据字段1,3,统计每分钟个数
5.根据3,统计2的条数
其实这些都能通过SQL查出来,但现在要用Cognos实现,想问问专家们有啥建议,最好是能做成多维的报表形式

没有维表,所有数据都在这个表里,比如A是时间,B是地域,C是产品类型

想用CUBE弄,2000万数据会不会太大,最后想用powerplay,大神有推荐资料没

如果不用CUBE,用FM,然后直接写SQL做报表会很慢吧

2000w数据用SQL会很慢啊,用CUBE能快点么
已邀请:
2

茳桦 - BI售前支持,cognos工程师 2013-12-05 回答

一张宽表里面存放了所有的字段,三个字段为维度,其他为度量,对于这样的问题,我就来讲讲我的处理经验吧。
1.对于有限可固定的维度(比如时段只有早上,中午,晚上;地区等只有东北,东部,东南,西北,西部,西南,北方,南方)这样的维度,直接写死(select 1 as id ,‘早上’ as partim from dual),并列写多个,拼出来一个伪维度了,效率高。
  1. 对于不固定维度(例如店铺,产品之类的),只要拉出来维度信息字段就可以了(select SHOP_ID,SHOP_NAME from tablename ),这就是维表了。不同的维度信息,拉出来不同的维表。
  2. 不做cube的话,就在物理层添加关系。发布就可以了。
  3. 做cube的话,物理层不添加关系。在transformer将关系处理好,就可以了(跟维表关系)。
0

hupingzhi - 大数据架构师 2013-12-05 回答

补充一点,这张表中维度三个字段加上索引。可以很大提高效率。

要回复问题请先登录注册