当要处理的文件远大于内存时,spark是如何解决的?此时会比mapreduce快吗?如何保证的?

0
已邀请:
0

MarsJ - 大数据玩家~DS 2016-09-13 回答

Spark有存储级别(缓存、内存、磁盘),当数据量达到内存大小的时候,会开始根据一些内存调度算法进行溢出到磁盘的操作。
仍然是比MR快的

要回复问题请先登录注册