新接手一个BI项目时,心里多少会觉得有些抵触和挑战,尤其是进入一个从未踏足的领域,没有行业知识积累。不过凡事都是有套路的,Kimball建模方法论就是目前最好的套路,光有套路实际的操作性还是不够,如果配上一系列工具,事情就变得更容易分解和执行,剩余的就是工作量问题了。
今天就和大家分享下我用的一套Excel模板,涵盖业务分析、报表需求整理、指标定义、主题域分析建模、维度表梳理、事实表建模。把繁杂的业务整理清楚是非常有挑战的事情,如果其中某一步卡住没有进展,可以暂时放下,去做后续的工作,做的过程中之前的一些疑惑就自然打通了。例如对业务过程进行归纳抽象数据域时没有清晰的思路,那就先大概整理后跳过,开始做指标的整理,整理指标的过程会帮助梳理整个数据盘子,如何分门别类。整个过程是螺旋式的实施过程。
需求调研主要分为两大部分,一是了解各个业务领域,业务线分为哪些模块,核心的业务动作有哪些,业务线如何衔接,识别业务动作非常重要,因为数据产生自业务动作;二是数据分析的需求,需要做什么报表,有哪些指标,在什么维度分析。对应的模板就是《功能模块/业务线的业务动作》和《报表和分析需求》。
功能模块/业务线的业务动作
报表和分析需求
需求调研后就是整体的数据架构设计或者是蓝图设计,划分数据域和构建企业数据总线,明确每个数据域下有哪些业务过程,业务过程与哪些维度相关。对应的模板是《数据域》和《总线矩阵》。
数据域
总线矩阵
有了数据总线的指导,可以把需求调研中的数据分析需求进一步整理,形成指标系统,把散乱的报表需求规范化,有利于后续维度和事实表的建立。指标可以分为基础计算类指标和需要挖掘分析类的指标。
指标定义
下面就是建立主题域概念模型,然后做维度建模和事实建模。这里的主题域概念模型比较简陋,也可以借助其它建模工具做的更完善,这里用Excel主要就是图方便,能够快速识别出相关实体,用于事实表建模即可。建模初期面临大量数据字段的整理,以及考虑如何满足数据报表分析需求,用Excel建模非常快捷方便,可以随意调整。如果对建模精细度有更高,可以用Excel模板作为分析设计阶段的初级模型,再用专业的建模工具做逻辑模型和物理模型。
主题模型
维度表
事实表模板有两个,一个是所有事实表的汇总,方便了解全局,标明事实表的对应的数据层、表类型、以及对应的报表应用;二是事实表模板。
订单交易事实表
交易汇总表
事实表汇总
PS:需要模板源文件的打赏后加微信( jianjun768 )索取