请教大家一个问题 hive版本1.0 分区有没有上限呢 是不是越多越好

0
已邀请:
1

regan - run! run! run! happy runner! 我是奔跑的小米~ 2017-03-17 回答

并不是越多越好,你可以这样理解,hive的分区只是一个map的key,很显然要根据key寻找value,其时间复杂度为O(n),key越多遍历找key的时间越长,因此并不是越多越好~
如果你说的是hive以多个字段分区,hive内部只是按这几个字段组建了多个层级的目录。也不是层级目录越多越好,遍历目录的时间复杂度也是O(n)

要回复问题请先登录注册