简述hadoop和spark的shuffle_CDA答疑社区

热线电话：13121318867

登录

大魔王泛泛

2020-02-28 阅读量: 730

简述hadoop和spark的shuffle

hadoop：map端保存分片数据，通过网络收集到reduce端

spark：spark的shuffle是在DAGSchedular划分Stage的时候产生的，TaskSchedule要分发Stage到各个worker的executor，减少shuffle可以提高性能

0.0000

0

2

关注作者

收藏

评论(0)

发表评论

暂无数据

CDA考试动态

CDA报考指南

推荐帖子