PGC123

2019-06-27   阅读量: 705

大数据 数据分析师 Hive

如何设置hive计算过程的reduce数目?

扫码加入数据分析学习群

如何设置hive计算过程的reduce数目?

答:reduce数目设置方式如下:

参数1:hive.exec.reducers.bytes.per.reducer=1G:每个reduce任务处理的数据量

参数2:hive.exec.reducers.max=999(0.95*TaskTracker数):每个任务最大的reduce数目

reducer数=min(参数2,总输入数据量/参数1)

set mapred.reduce.tasks:每个任务默认的reduce数目。典型为0.99*reduce槽数,hive将其设置为-1,自动确定reduce数目。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
33.9199 1 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子