大数据

请教个问题，现在的大数据的一些平台像Spark/hadoop 在企业BI是怎么共存，和相互补充的？

0

重要提示：提问者不能发表回复，可以通过评论与回答者沟通，沟通后可以通过编辑功能完善问题描述，以便后续其他人能够更容易理解问题.

课程推荐：实战秘技，经典案例，一门课程锤炼数据分析师八大能力！

2 个回复

0

铁皮罐头 - BIEE独立顾问 2016-08-29 回答

基本上都是在BI体系上进行扩展的，现在很多企业应用都是增加运行效率。但是以后会随着各种行业的算法，机器学习等不同数据处理方式的完善，应用前景会更广

1

MarsJ - 大数据玩家~DS 2016-08-29 回答

如果企业已经有传统的BI，可以将BI前期的ETL和数据处理分析等工作挪到Spark、Hadoop上，BI只需要通过某种方式使用Hadoop、Spark的结果输出就行了。这里举例一种方式：BI是用Pentaho实现的，将Hadoop上做的日志分析结果导出到关系型数据库MySQL中，Pentaho系统直接读取Hadoop的导出结果就可以了。
如果企业还没有BI，可以根据根据企业特性构建Hadoop、Spark集群，然后在此基础上构建适合企业的BI平台，现在非常流行的Apache Kylin就非常适合做多维分析。也有些公司的BI是通过底层的Hadoop+Spark，然后结合Hive和HBase构建一个比较丰富的大数据平台，再加上Kylin做OLAP来构建数据模型，然后对接一套Web前端系统，例如AirBNB开源的Carvavel或Saiku。
不同的团队有不同的选择，根据你们的业务和团队需要去选择。

要回复问题请先登录或注册

请教个问题，现在的大数据的一些平台像Spark/hadoop 在企业BI是怎么共存，和相互补充的？

2 个回复

发起人

相关问题

问题状态

请教个问题，现在的 大数据的一些平台像Spark/hadoop 在企业BI是怎么共存，和相互补充的？

与内容相关的链接

2 个回复

发起人

相关问题

问题状态

请教个问题，现在的大数据的一些平台像Spark/hadoop 在企业BI是怎么共存，和相互补充的？