使用Hive来查询Hbase存储的数据有什么缺点?

0
由于Hive不太方便维护Update, 在项目中的确又存在这样的需求, 所以使用Hbase来维护数据.

但是Hbase只能使用主键查询,这样查询又不是很方便. Team已经习惯了使用SQL来查询, 发现Hive 可以比较容易的查询Hbase里面的数据. 优点是显而易见,也很吸引人.

那问题是,这样查询除了性能问题,还有什么其他的缺点吗? 相比Hive直接查询HDFS的数据, 性能又有多大的损耗.
已邀请:
1

牟瑞 - 大数据 Hadoop 讲师 Hadoop入门课程地址:http://www.hellobi.com/course/39 有架构师,技术总监,CTO的职位请联系我! 2015-10-17 回答

因为我们目前项目上没有这么用的,所以,简单的说一下我的理解:
1.性能问题肯定是有的,hive需要去解析hbase的表结构,必然会带来查询性能的问题
2.维护成本,hive偏向数据分析部门,hbase偏向实时业务系统,两者本身的出发点不是一点,整合在一起必然带来维护成本的提升。
3.hive的某些特性无法充分发挥:比如分区,分桶等等
 
个人还是建议:
hbase的数据做为业务系统来用,通过etl来定期抽取数据到数据仓库(hive)中,这样各自满足各自的需求。
 

要回复问题请先登录注册