你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
没有找到相关结果
philbert 2016-03-29 回答
赞同来自:
SmartMining - 数据挖掘、商业智能、大数据从业者:相关产品设计、项目管理、咨询、培训 2016-03-29 回答
要回复问题请先登录或注册
挖掘学习,爱好者
推荐一份编程学习资源,包含了各类编程语言学习进阶路线图、视频教程、配套书籍文档、数百份面经,各大厂面试真题。编程语言包括:Java、前端、PHP、Python、Linux运维、软件测试、数据解构与算法、C语言、go语言等
微信扫码关注公众号,发送 "编程"获取资源
2 个回复
philbert 2016-03-29 回答
赞同来自:
1 简单来说数据集市的产生要以数据仓库作为基础,建立数据仓库的目的是提供面向主题的、集成稳定的、随时间不断变化的数据集合,数据仓库关心的是数据本身如何合理有效的存放,而数据集市是在数据仓库基础上建立的面向某一个或一类具体应用目标的数据集合,数据集市关心的是如何从数据仓库中提取出满足自身应用切实需要的数据信息。
2 举个类比的例子来说,如果把应用目标看作制作菜肴,数据仓库可能就是我们的原料柜,里面存放了制作各种菜肴需要的原料,而数据集市就是从原料柜里取出的针对某一道具体菜肴的制作原料,而具体的数据分析挖掘过程就是我们烹饪菜肴的过程。
综上,数据集市的建设可以被看成针对应用分析目标进行的数据设计和准备的过程,高质量的数据集市可以为后面的数据分析挖掘处理奠定良好的基础,有助于取得优质的数据分析挖掘的结果和模型。
SmartMining - 数据挖掘、商业智能、大数据从业者:相关产品设计、项目管理、咨询、培训 2016-03-29 回答
赞同来自:
第一,在模型训练阶段,需要把挖掘建模所需要的数据提供到集市中,此时集市中的数据只要是做挖掘的所需的数据就可以了,和挖掘的程序没有关系,只要满足此次挖掘所有的数据即可,保证数据的准确性;
第二,在模型部署阶段,已经训练好的挖掘模型,会转化成程序定时执行部署应用。此时模型执行所需的数据也可以基于数据集市来支撑,此时数据集市提供的数据必须要模型所需的数据完全一致,否则程序将无法执行。