flume或chukwa采集了数据,直接进hdfs,这样肯定是许多较小的文件,有各自的命名吧?这样的话,后期的mapreduce,怎么对这些文件操作?

0
已邀请:
1

MarsJ - 大数据玩家~DS 2016-07-29 回答

此时需要进行HDFS的小文件合并,根据小文件数目定期合并。

要回复问题请先登录注册