2
推荐
6880
阅读

数据仓库系列 - 一般数据库增量数据处理和数据仓库增量数据处理的几种策略

开篇介绍通常在数据量较少的情况下,我们从一个数据源将全部数据加载到目标数据库的时候可以采取的策略可以是:先将目标数据库的数据全部清空掉,然后全部重新从数据源加载进来。这是一个最简单并且最直观的并且不容易出错的一种解决方案,但是在很多时候会带来性能上的问题。如果我们的数据源来自于不同的业务系统,数...

发表了文章 • 2017-09-26 20:57 • 0 条评论

6
推荐
7051
阅读

数据仓库系列 - 缓慢渐变维度 (Slowly Changing Dimension) 常见的三种类型及原型设计

开篇介绍在从 OLTP 业务数据库向 DW 数据仓库抽取数据的过程中,特别是第一次导入之后的每一次增量抽取往往会遇到这样的问题:业务数据库中的一些数据发生了更改,到底要不要将这些变化也反映到数据仓库中?在数据仓库中,哪些数据应该随之变化,哪些可以不用变化?考虑到这些变化,在数据仓库中的...

发表了文章 • 2015-09-26 21:00 • 15 条评论

3
推荐
5018
阅读

数据仓库系列 - 数据仓库设计之一个属性的维度设计

开篇介绍我们通常在数据仓库的设计中碰到这种问题:在维度设计中如果这个维度只有一个属性,那我们面临的选择是为这个属性单独创建一个维度,还是将这个维度的属性直接放在事实表中作为事实表的一部分?案例解释假设这里有一个维度,通常在设计上至少会有两列(DimKey 和 DimAttribute 属性),事实表通过 DimKey 关联到...

发表了文章 • 2015-09-22 09:30 • 2 条评论