数据仓库中的老数据需要删除或是汇总吗?
0
本人是用户,我用过的库不管是仓库还是源系统,都保留20年以上的数据。仓库里的交易事实表,都存有很老的历史数据。
但是我看别人在谈坛中 都说老数据要删掉 不然影响速度之类。
数据仓库开发经理当然希望删除 - 数据越简单,时间越短 维护越方便啊,今天为这事还和争辩起来了
我作为用户觉得应该予以保留,这样可以分析出比如10年的老客户和新客户的区别
各位的系统里要考虑这个问题吗?请大神来说说吧,谢谢
但是我看别人在谈坛中 都说老数据要删掉 不然影响速度之类。
数据仓库开发经理当然希望删除 - 数据越简单,时间越短 维护越方便啊,今天为这事还和争辩起来了
我作为用户觉得应该予以保留,这样可以分析出比如10年的老客户和新客户的区别
各位的系统里要考虑这个问题吗?请大神来说说吧,谢谢
没有找到相关结果
重要提示:提问者不能发表回复,可以通过评论与回答者沟通,沟通后可以通过编辑功能完善问题描述,以便后续其他人能够更容易理解问题.
1 个回复
cinemat - 徘徊在工业界和学术界之间的魔法师 2015-11-11 回答
赞同来自: 梁勇 、julian235
基础数据区里面通过历史表(拉链表)来保存重要信息的历史数据,一般客户类、账户类等信息要保留7年(这个规则一般适用于西方经济体制,
近似于一个完整的经济周期,和重大的业务规划目的),交易类流水类信息要保留至少13个月以上。除此之外,重要代码、主数据也要通过历
史表保存历史。
落地时具体和客户的实际情况有关,比如当前有一家银行因为SDATA数据是从Oracle通过DataStage抽取过来的,没有文件落地,其SDATA区
就当历时库用保存了几年的(其他银行一般都保留7天),人家行财大气粗不在乎这点空间。