想请教一下大神们,如果一个监管系统,客户的数据一部分来源于业务系统一部分来源于互联网,我要用hadoop,各部门数据怎么存储合适呢

0
已邀请:
1

Bob - 同程旅游大数据+BI 架构师 2016-03-18 回答

如果你只是使用hadoop,那么在hdfs上对不同的数据做目录,然后使用hive映射到对应的hdfs目录。
 
hive可支持你使用sql来完成对数据的统计和分析
当然如果你想得到即席查询的效果,也可以在hadoop集群上构建impala drill等组件。

要回复问题请先登录注册