业务数据库中常常修改数据,这种情况下该如何处理

0
我列举一个业务现象:
我们的门店零售单子,到月结的时候,有人发现对不上账,就去反审核申请,通过后进行数据更正。
这样的话就比较麻烦,因为前期我们已经将相关数据抽取了过来,加入本月内,他月结的时候更改了部分数据,这里面有个modi_date会记录下他更改的时间。
这个表还有一个字段posteddate,就是审核时间
首先我抽取不能以审核时间为参考,因为审核往往是几天以后才去审核,我们有时要取得当天的销售数据
这样的情况下我准备采取的手段是 将近两个月内的数据进行删除然后进行抽取,这样保证近一个月内数据是最新的,也不管他有没有改,或者更正什么的
我就怕大量的数据,每天都上百万的那种,请教遇到这种情况该如何处理。
请教做过这种有修改数据的表抽取的指点一下,因为这张表里一般有创建时间、修改时间和审核时间。
这种情况要保证数据的及时性,还要保证修改数据的准确性,还要应付大量的数据量。
我的考虑基本上是上面三点,请老师给予指点。
已邀请:
0

天桥下的郑成功 - Hadoop大数据开发工程师、数仓架构师、熟悉数据仓库设计、Hadoop、Spark、HBase、Hive、SSIS等开发 2014-08-27 回答

不是很明白你说的,可以将相应的表结构贴一下。 这样方便帮你分析。

要回复问题请先登录注册