你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!

Hadoop

flume或chukwa采集了数据，直接进hdfs，这样肯定是许多较小的文件，有各自的命名吧？这样的话，后期的mapreduce，怎么对这些文件操作？

0

重要提示：提问者不能发表回复，可以通过评论与回答者沟通，沟通后可以通过编辑功能完善问题描述，以便后续其他人能够更容易理解问题.

课程推荐：实战秘技，经典案例，一门课程锤炼数据分析师八大能力！

1 个回复

1

MarsJ - 大数据玩家~DS 2016-07-29 回答

此时需要进行HDFS的小文件合并，根据小文件数目定期合并。

要回复问题请先登录或注册