Hadoop及其构成-CDA数据分析师官网

热线电话：13121318867

登录

首页精彩阅读Hadoop及其构成

Hadoop及其构成

2017-05-24

收藏

Hadoop及其构成

玩计算机需要先装一个windows系统（或linux系统）。同样道理，玩大数据也要有个大数据系统，用于将数据汇聚起来，加以分析和处理，将其中有价值的信息分析出来，让人们认清事物的全局、预测未来的变化趋势。Hadoop是当前最为流行的两个大数据系统之一。

Hadoop是一个开源分布式计算平台。用户可以利用Hadoop轻松地组织计算机资源，从而搭建自己的分布式计算平台，并且可以充分利用集群的计算和存储能力，完成海量数据的处理。Hadoop已广泛地被企业用于搭建大数据库系统，据不完全统计，全球已经有数以万计的Hadoop系统被安装和使用，国内知名的中国移动、百度、阿里都在大规模地使用Hadoop系统。随着互联网的不断发展，新的业务模式还将不断涌现，Hadoop的应用也会从互联网领域向电信、电子商务、银行、生物制药等领域拓展。

Hadoop是Apache组织正在推进的项目。这个项目主要由两大部分的子项目构成，一个是基础部分，另一个是配套部分。

1）基础部分

（1）Hadoop Common。Hadoop Common是支撑Hadoop的公共部分，包括文件系统、远程过程调用RPC和序列化函数库等。

（2）HDFS。HDFS是可以提供高吞吐量的可靠分布式文件系统，是Google GFS的开源实现。

（3）MapReduce。MapReduce是大型分布式数据处理模型，是Google MapReduce的开源实现。

2）配套部分

（1）HBase。HBase是支持结构化数据存储的分布式数据库，是Google BigTable的开源实现。

（2）Hive。Hive是提供数据摘要和查询功能的数据仓库。

（3）Pig。Pig是在MapReduce上构建的一种脚本式开发方式，大大简化了MapReduce的开发工作。

（4）Cassandre。Cassandre是由Facebook支持的开源、高可扩展分布式数据库，是Amazon库层架构Dynamo的全分布和Google BigTable的列式数据存储模型的有机结合。

（5）Chukwa。Chukwa是用来管理大型分布式系统的数据采集系统。

（6）Zookeeper。Zookeeper用于解决分布式系统中一致性问题，是Google Chubby的开源实现。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

Hadoop 大数据数据存储 HDFS Hive 分布式计算集群数据处理

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇回归系列（一）| 怎样正确地理解线性回归

下一篇2020美国总统竞选大戏开锣，川普当选的奇迹会再发生吗？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

更多

Copyright © 2015-2021, www.cda.cn All Rights Reserved. CDA数据分析师(北京国富如荷网络科技有限公司) 版权所有京ICP备11001960号-9

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

OK

客服在线

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册