数据仓库中的老数据需要删除或是汇总吗?

0
本人是用户,我用过的库不管是仓库还是源系统,都保留20年以上的数据。仓库里的交易事实表,都存有很老的历史数据。
但是我看别人在谈坛中 都说老数据要删掉 不然影响速度之类。
数据仓库开发经理当然希望删除 - 数据越简单,时间越短 维护越方便啊,今天为这事还和争辩起来了

我作为用户觉得应该予以保留,这样可以分析出比如10年的老客户和新客户的区别
各位的系统里要考虑这个问题吗?请大神来说说吧,谢谢
已邀请:
2

cinemat - 徘徊在工业界和学术界之间的魔法师 2015-11-11 回答

数据的生命周期与行业、自己本身的需求有关,比如金融业“在设计银行数据保存周期策略时,最常用的经验法则是7年和13个月规则”
基础数据区里面通过历史表(拉链表)来保存重要信息的历史数据,一般客户类、账户类等信息要保留7年(这个规则一般适用于西方经济体制,
近似于一个完整的经济周期,和重大的业务规划目的),交易类流水类信息要保留至少13个月以上。除此之外,重要代码、主数据也要通过历
史表保存历史。

落地时具体和客户的实际情况有关,比如当前有一家银行因为SDATA数据是从Oracle通过DataStage抽取过来的,没有文件落地,其SDATA区
就当历时库用保存了几年的(其他银行一般都保留7天),人家行财大气粗不在乎这点空间。

要回复问题请先登录注册