Reduce端的代码效率是不是远低于mapper端的代码?

0
我写了一个Mr程序,mapper就是读取文件,然后按KEY存,主要在reduce里面进行计算(因为源文件有很多同KEY的行,所以考虑用reduce的同KEY聚合的特性).

就是觉得这种设计,似乎mapper端不起啥作用,主要计算压力都放在reduce端了.而reduce端一般是没有进行分布式计算的(如果reduce num设置为1的话)
已邀请:

要回复问题请先登录注册