Reduce端的代码效率是不是远低于mapper端的代码?
0
我写了一个Mr程序,mapper就是读取文件,然后按KEY存,主要在reduce里面进行计算(因为源文件有很多同KEY的行,所以考虑用reduce的同KEY聚合的特性).
就是觉得这种设计,似乎mapper端不起啥作用,主要计算压力都放在reduce端了.而reduce端一般是没有进行分布式计算的(如果reduce num设置为1的话)
就是觉得这种设计,似乎mapper端不起啥作用,主要计算压力都放在reduce端了.而reduce端一般是没有进行分布式计算的(如果reduce num设置为1的话)
没有找到相关结果
重要提示:提问者不能发表回复,可以通过评论与回答者沟通,沟通后可以通过编辑功能完善问题描述,以便后续其他人能够更容易理解问题.
0 个回复