数据仓库代理键选择问题,欢迎大家给出宝贵意见

0
在数据仓库建模的时候,经常会遇到缓慢变化维的问题,而通常的处理会使用代理键来处理,
维度表每发生变化,都会在表里新插入一条数据,同一个维度信息的代理键不同,而自然键相同。
维度和事实表之间使用代理键做join,想问问大侠们代理键用什么生成,用数据库的自增字段来做么?
如果用自增字段,在数据删除、恢复中会不会出现与原来数据对应不上的问题?
已邀请:
0

BIWORK - 热衷于微软BI技术,技术架构和解决方案! 2014-08-01 回答

一般都是使用自动增长的方式,方便建立索引效率也高。并且维度表和事实表这些数据一旦入了库基本上不会做删除操作,如果 Fact 表做了删除操作,只不过事实数据无法和维度数据关联,如果维度表做了删除,Fact 表也就是处理成 Unknown 成员。并且一般也不会去做数据恢复操作,最多重跑数据。

也可以参考这两篇文章有关于渐变维度的原型介绍。
数据仓库系列 - 缓慢渐变维度 (Slowly Changing Dimension) 常见的三种类型及原型设计
http://www.cnblogs.com/biwork/p/3363749.html

SSIS 系列 - 数据仓库中实现 Slowly Changing Dimension 缓慢渐变维度的三种方式
http://www.cnblogs.com/biwork/p/3371338.html

要回复问题请先登录注册