创建cube时的事实表和维度表都是怎么创建的?

0

我碰到的问题是:现在有个关系数据库,对表A 进行分析。

表A字段:  AKey,AName,InsertTime,AStatus

现在需要天、周、月、年对A表进行统计,就是每天、每周、每月、每年分别新增了多少条记录。

针对这个问题,我要怎么创建维度表?事实表直接用A表还是需要新建,怎么建?谢谢!
已邀请:
2

BIWORK - 热衷于微软BI技术,技术架构和解决方案! 2015-09-10 回答

如果仅仅对表A这一张表做分析,不涉及到其它的表,可以简单的创建一个事实表:
FACT_TABLEA_RECORDS
两个字段就可以了:
  • 记录时间 - 每天插入到事实表的时间
  • 条数 - 表A每天抽取时当前天插入的条数

事实表粒度为天。
 
时间维度可以按照这篇文章中的脚本 http://www.cnblogs.com/biwork/p/3486240.html 可以拿到天、周、月和年。
这样可以快速的按天、周、月和年来聚合看到每天插入条数的记录和趋势图。

如果是对多张表做插入记录分析,可以再添加一个字段:
表名称
这样可以基于表名称然后按天、周、月和年来聚合看到各张表每天插入条数的记录和趋势图。
 
 
1

- 取是能力,舍是境界 2015-09-10 回答

确定维度首先要明确下分析的数据粒度,比如你现在分析需求中提到最小粒度是天。那数据ETL这块就要考虑,是以天粒度满足现有需求抽取还是以小时、分钟等考虑长远抽取事实数据。维度表和事实事通过代理键来关联。
举例:
数据抽取最小粒度为小时:
维度表:
主键                年          月          周               日
20150910      2015      09        201928        20190910
事实表:
代理键            度量值A             度量值B             度量值C
201509         
 
下面是天善的梁总,讲课中提到的构建数据仓库五步法,供参考。http://www.flybi.net/article/519
0

天桥下的郑成功 - Hadoop大数据开发工程师、数仓架构师、熟悉数据仓库设计、Hadoop、Spark、HBase、Hive、SSIS等开发 2015-09-10 回答

看了下你的需求,是不是只是单纯的想看每天有多少条记录?
如果是的话,直接把你这个事实表 和 日期维度表关联。
然后建立计算量值,比如 聚合方式采用Count记录数量

然后你就可以根据 时间维度+这个Count的组合 看每天的记录数了

要回复问题请先登录注册