面试问题哈

0
1:hive中数据倾斜问题,怎么解决?2:Flume出错的情况怎么解决,3:kafka是否会出现提前读取文件内容,为什么?
已邀请:
0

MarsJ - 大数据玩家~DS 2017-02-08 回答

数据倾斜需要对数据分布有了解,可以通过建立倾斜表处理,此外可以通过对倾斜数据指定任务数,从分布式计算任务的角度优化。

要回复问题请先登录注册