请教个问题 做数据挖掘的时候 数据放到数据集市 数据集市的建模 是不是要和 挖掘程序相关

0
已邀请:
0

philbert 2016-03-29 回答

这个问题建议楼主可以这样考虑:
1 简单来说数据集市的产生要以数据仓库作为基础,建立数据仓库的目的是提供面向主题的、集成稳定的、随时间不断变化的数据集合,数据仓库关心的是数据本身如何合理有效的存放,而数据集市是在数据仓库基础上建立的面向某一个或一类具体应用目标的数据集合,数据集市关心的是如何从数据仓库中提取出满足自身应用切实需要的数据信息。
2 举个类比的例子来说,如果把应用目标看作制作菜肴,数据仓库可能就是我们的原料柜,里面存放了制作各种菜肴需要的原料,而数据集市就是从原料柜里取出的针对某一道具体菜肴的制作原料,而具体的数据分析挖掘过程就是我们烹饪菜肴的过程。

综上,数据集市的建设可以被看成针对应用分析目标进行的数据设计和准备的过程,高质量的数据集市可以为后面的数据分析挖掘处理奠定良好的基础,有助于取得优质的数据分析挖掘的结果和模型。
0

SmartMining - 数据挖掘、商业智能、大数据从业者:相关产品设计、项目管理、咨询、培训 2016-03-29 回答

您好!建设挖掘所需的数据集市有两种情况:
第一,在模型训练阶段,需要把挖掘建模所需要的数据提供到集市中,此时集市中的数据只要是做挖掘的所需的数据就可以了,和挖掘的程序没有关系,只要满足此次挖掘所有的数据即可,保证数据的准确性;
第二,在模型部署阶段,已经训练好的挖掘模型,会转化成程序定时执行部署应用。此时模型执行所需的数据也可以基于数据集市来支撑,此时数据集市提供的数据必须要模型所需的数据完全一致,否则程序将无法执行。

要回复问题请先登录注册