Impala和hbase集成为什么会比直接在hdfs查询要慢很多?

0
已邀请:
0

MarsJ - 大数据玩家~DS 2016-06-20 回答

有比对数据吗?虽然没有实践过impala和Hbase集成,实验过Hive/Impala/Spark SQL,其中Impala的速度比Hive快很多,但是稍慢于Spark SQL。从理论上来讲,应该是更快才对。除非数据量很小,当数据量很小的情况下,这些用于大数据处理和查询的组件反而无法体现其巨大的性能。

要回复问题请先登录注册