请问数据仓库都用什么建立?数据库有oracle,db2,sqlserver等等,数据仓库都用什么工具啊

0
数据库有oracle,db2,sqlserver等等,数据仓库都用什么工具啊,具体怎么做,咨询下大家。
已邀请:
1

andrea_zhou - 咨询顾问、BA 2015-10-09 回答

数据仓库,如果你作为概念来理解的话,他可以用大多数的数据库产品来解决。
譬如,数据仓库可以建立在DB2里,也可以建立在Oracle,SQL Server里。
与这些平台没有太多的紧密或是必然的联系,但是有些平台里会有对数据仓库的特别支持,一个例子是Oracle的OLAP Option。
如果你把数据仓库从产品角度来看,那么会有一些产品,乃至硬件软件一体机的产品。Teradata可以归作这一类吧。
至于建立数据仓库的过程中,可以通过手工脚本,也可以使用ETL工具来实现。
ETL工具也会有很多种的了。譬如SSIS,Infomatica,Datastage,Kettle等等。
1

BIWORK - 热衷于微软BI技术,技术架构和解决方案! 2015-10-09 回答

数据仓库的建立本身是不需要什么工具的,数据仓库本质上就是一个数据库上的一些普通的表,只不过我们给它们按照用途的区别从命名上分了一下类:维度表和事实表,这些表跟普通的关系型数据库表在创建和使用上没有任何差异,语法完全一致,主外键什么该有的也一样有。
 
之所以需要用到一些工具,这些工具我们把他们成为 ETL 工具,为的是解决从不同数据源将数据进行 E-Extract 抽取,T-Transformation 转换,L-Loading 加载到数据仓库这样的一个过程。
 
当数据源本身就是关系型数据库的时候,这种 ETL 工具完全可以就是普通的 SQL 语句,就是解决从一个数据库抽取一份数据到另外一个数据库表的问题。
 
但是,当数据源变得非常复杂变得多样化的时候,传统的 SQL 是没有这种能力全部高效的解决数据抽取和清洗的问题 -
比如多数据源链接参数化配置管理,文本文件的抽取,EXCEL 数据的抽取,FTP 数据的抽取,最重要的是多个抽取还是并行处理的,这些是一般的 SQL 语句写是没有办法写出来的。
 
ETL 工具的作用就是用来解决这些问题,多数据源接口管理,各种数据清洗与转换控件,多线程并行处理,图形化的操作界面,这些功能不是一般 T-SQL 语言能够处理的。
 
这几个图是微软 BI SSIS 工具 你可以看看这些了解 SSIS 并入门:http://www.hellobi.com/course/22
1.jpg

2.jpg

其它的 ETL 工具基于 Oracle, DB2 等应该包括 Kettle, DataStage, Informatica,你可以看看这些视频学习和了解他们。
http://www.hellobi.com/course/explore/etl
1

老头子 - 专注是唯一的捷径 2015-10-09 回答

数据库有oracle,db2,sqlserver等等,数据仓库都用什么工具啊,具体怎么做,咨询下大家。
--你可以理解为数据仓库的工具也是oracle,db2,sqlserver等等,去百度下数据仓库和数据库的关系和区别就知道了,你的问题在于没搞清楚数据仓库的定义和概念。

要回复问题请先登录注册