A. Hadoop + Hive B. GreenPlum + PostGreSQL 大数据存储,这两个方案各有什么特点啊

0
 A. Hadoop + Hive 
B. GreenPlum + PostGreSQL
大数据存储,这两个方案各有什么特点啊 
 
已邀请:
3

Bob - 同程旅游大数据+BI 架构师 2015-11-30 回答

 A. Hadoop + Hive 
支持新增节点,过程中不需要重启
支持jdbc访问hive数据库
支持sql的方式获取数据
在技术过程中,数据是以批量的方式来执行。如果Hadoop集群中架设了tez引擎,则计算数据会提高不少
如果想支持即席查询,则需要drill,impala组件辅助
集群规模可达到上万
容灾性比较好,一两台机器出现问题不影响整体
可视化工具方面比较少,常用hue,zepplin等
能与当前的Hadoop生态其他组件完全融合,有很多弹性的选择。
开源生态最健壮

B. GreenPlum + PostGreSQL
支持新增节点,但过程中需要重启
集群规模很少有上千的,一般都是几十上百台
支持jdbc访问数据库
支持sql的方式获取数据
支持即席查询
与当前的传统BI工具可很好的结合

要回复问题请先登录注册