热线电话:13121318867

登录
2020-02-20 阅读量: 1175
HDFS上小文件过多带来的影响

1. 内存占用 每个小文件都会在namenode中存有相应的元数据信息.如果每一个文件的元数据信息占用内存100byte,那么有10万个小文件, 就占用了namenode10G的内存空间

2. 数据查询慢 小文件过多也会影响系统的查询速度

3. 浪费资源 在hadoop上进行数据计算时,每一个小文件都要对应一个task, 而每一个task启动阶段会耗费大量的时间在任务资源申请和释放上

0.0000
2
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子