如果维度的编码和源数据编码不一致,有没有比较好的对照方式推荐下?-天善学员群讨论整理

0
问:数据转换只能转换数据类型长度等等。。
我想问的是。。假设抽取的是部门维度。
源数据 维度表
1 财务科 3财务科
2 市场部 4市场部。。
答:先从业务考虑,制定业务规范,不同系统导入系统,每个系统编码都不一样,类型也不一致。做好编码映射关系表

问:因为我有多个源,每个源去做映射关系表,维护时会比较麻烦。这个映射关系建立在哪比较好。
答:就是要考虑业务需求,是否在本数据仓库系统做成统一编码,虽然外围系统编码怎么变,在本系统是统一的,业务编码的转换在数据系统中,是存在同维度值成员对应多个系统同名不同编码。当然是数据存储平台来处理。数据编码统一了,也方便做报表,给其他系统提供接口访问数据

问:数据仓库设计 编码是统一的。。没存储平台。。
答:技术上实现,就是通过程序与工具批量化。有没有不要紧,但是思路要存在,数据仓库可大可小。大到企业级,小到OA系统。自己根据需要制定维度转码表,比如,产品转码表,机构统一编码表,在原来的表增加几个字段,老编码还是存在的,新编码是人工维护的。后续通过界面进行维护,可以通过程序维护。看什么方便就怎么设计。做报表可以满足老报表需求,又可以满足新标准设计。这样做有个好处,对大型的数据仓库系统,做上百的报表,便于统一指标口径与报表规范

问:你这个转码表是建立的源数据业务表上面的喽。。
答:业务过程性的数据,在加载前是不处理。做高度业务整合时,利用维度表转码,变成分析型数据时就统一了。追溯指标口径时,新标准和老标准都数据上都可以查。加载前是不处理:是指入原子层的数据,接入是一对一,保持原系统的表数据不变。如果是简单的做几张表,不考虑工作内容放大,人力投入成本,也可以简单化。就是功能裁剪

总结:做一个代码表,有的叫字典转码表、字段值域映射表,需要转换的,代码映射关系。其他业务表结构不发生变化,保持现状
已邀请:

要回复问题请先登录注册