请教个问题,现在的 大数据的一些平台像Spark/hadoop 在企业BI是怎么共存,和相互补充的?

0
已邀请:
0

铁皮罐头 - BIEE独立顾问 2016-08-29 回答

基本上都是在BI体系上进行扩展的,现在很多企业应用都是增加运行效率。但是以后会随着各种行业的算法,机器学习等不同数据处理方式的完善,应用前景会更广
1

MarsJ - 大数据玩家~DS 2016-08-29 回答

如果企业已经有传统的BI,可以将BI前期的ETL和数据处理分析等工作挪到Spark、Hadoop上,BI只需要通过某种方式使用Hadoop、Spark的结果输出就行了。这里举例一种方式:BI是用Pentaho实现的,将Hadoop上做的日志分析结果导出到关系型数据库MySQL中,Pentaho系统直接读取Hadoop的导出结果就可以了。
如果企业还没有BI,可以根据根据企业特性构建Hadoop、Spark集群,然后在此基础上构建适合企业的BI平台,现在非常流行的Apache Kylin就非常适合做多维分析。也有些公司的BI是通过底层的Hadoop+Spark,然后结合Hive和HBase构建一个比较丰富的大数据平台,再加上Kylin做OLAP来构建数据模型,然后对接一套Web前端系统,例如AirBNB开源的Carvavel或Saiku。
不同的团队有不同的选择,根据你们的业务和团队需要去选择。

要回复问题请先登录注册