2020-02-20
阅读量:
1175
HDFS上小文件过多带来的影响
1. 内存占用 每个小文件都会在namenode中存有相应的元数据信息.如果每一个文件的元数据信息占用内存100byte,那么有10万个小文件, 就占用了namenode10G的内存空间
2. 数据查询慢 小文件过多也会影响系统的查询速度
3. 浪费资源 在hadoop上进行数据计算时,每一个小文件都要对应一个task, 而每一个task启动阶段会耗费大量的时间在任务资源申请和释放上






评论(0)


暂无数据
推荐帖子
0条评论
1条评论
0条评论