【摘文】企业级数据仓库架构,Inmon or Kimball?

浏览: 2767

在我们设计数据仓库时,当前最常讨论的两种方法J就是Bill Inmon和 Ralph Kimball方法。关于哪种方法更好、哪种更高效的争论已经持续了好几年,但是一直没有一个明确的结论。本文首先介绍了两位大师的两种数据仓库架构,并做了一些对比,希望对您在选择企业级数据仓库架构时有所帮助。


首先,让我们来快速浏览一下两种方法。

Inmon自上而下的方法

  Inmon将数据仓库定义为整个企业级的集中存储库。数据仓库存放着最低的详细级别的原子数据。维度数据集市只是在数据仓库完成以后才创建的。因此,数据仓库是企业信息工厂(CIF)的中心,它为交付商务智能提供逻辑框架。


Inmon用以下术语定义数据仓库:

  1.面向主题:数据仓库中的数据被组织成所有数据元素都与真实世界的事件或对象相关联。

  2.随时间而变化:数据库中数据的改变是可以被跟踪和记录的,可以通过报表显示出数据随时

  3.非易失性:数据仓库中的数据不会被修改或删除。一旦进入数据仓库,数据就是静态的,只读的,只用来为以后提供报表。

  4.集成的:数据库包含来自组织的大部分或所有的业务应用系统数据,而且这些数据是一致产生的


Kimball自下而上的方法

  记住,最重要的业务单元或部门的数据集市要先建立。这些数据集市可以为透视组织数据提供一个较窄的视图,需要的时候,这些数据集市还可以与更大的数据仓库合并在一起。Kimball 将数据仓库定义为“一份针对查询和分析做特别结构化的事务数据拷贝。”

  Kimball 的数据仓库结构也就是著名的数据仓库总线(BUS)。维度模型关注的重点是:如何使最终用户访问数据仓库更容易,并有较高的性能。



Inmon和Kimball有什么异同?



两种方法的优点和缺点


如何决策?

  正如我们刚才已经看到的,选择哪种数据仓库设计方法取决于组织的业务目标、业务特性、时间、成本、不同组织单元之间的相互依赖级别。Inmon 的方法比较适合稳定的业务,这些业务能花得起时间做设计也能承担相关的成本。随着每次业务条件的改变,设计不用改变;可以将这些变化包括在现有的模型中。然而,如果本地优先级足够高,而且重点是要快速看到效果,那就建议采用Kimball的方法。记住,让一些部门/组织单元来讨论是选用Inmon方法还是Kimball方法。

  • 保险:了解单个客户、群组的每一次计划和代理的历史、成功失败的趋势、人口统计学、赢利性 的整体状况很重要。如果所有的方面都是相关的,那就比较适合采用Inmon的方法。
  • 市场:这是一个特别的分支,不能叫做企业数据仓库。只需要数据集市就够了。因此,Kimball的方法比较适合。
  • 银行的CRM:关注点是产品销量和客户级别的交叉销售。不必要获得业务的整体视图。例如,不需要将客户的详细信息与处理外汇交易和规则的财务部门相关联。因为范围限制,只能采用Kimball的方法。然而,如果银行中的整个流程和部门相互关联,显然选择Incon的设计要比Kimball方法要好。
  • 制造业:这里涉及到多个组织单元,不必考虑预算。这种情况没有系统依赖,因而需要企业模型,这时还是Inmon的方法比较理想。

  在设计数据仓库时,首先要先看看业务目标——短期目标和长期目标。看看功能之间哪里有联系,什么是独立的。分析数据源的数量和质量。最后,评估你的资源级别、时间和经费。这能帮助你判断用Inmon方法还是用Kimball方法,或者是两种方法的组合。

推荐 3
本文由 GeorgeYao 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册