之前的文章中我们已经将master节点的网络IP、hostname文件、hosts文件配置完成,接下来还有hadoop相关配置文件需要修改。今天我们来讲master节点hadoop的配置。
1、hdfs-site.xml
在hadoop的配置文件中与HDFS(hadoop分布式文件系统)相关的是hdfs-core.xml文件。在伪分布集群中只有一个节点,因此此节点即要有NameNode功能也要有DataNode功能。在工作环境中这两个是不会在一个节点上的,在我们的多节点分布式集群中master只运行NameNode因此需在hdfs-site.xml文件中删除DataNode相关配置。
打开虚拟机在终端中输入cd hadoop/etc/hadoop 命令进入hadoop配置文件目录。
终端输入命令vim hdfs-site.xml进入vim编辑界面,按下图步骤删除原来伪分布集群配置的DataNode相关配置,并将数据冗余数量设置为2。
输入i进入编辑模式,编辑后的文件内容如下所示。
最后退出编辑模式,保存并退出。
2、core-site.xml
在core-site.xml中指定一个节点运行hdfs服务。在之前伪分布集群中只有一个节点,因此我们使用的是localhost,如今在集群中有三个节点,我们约定使用master。
在终端中输入vim core-site.xml按下图操作修改配置文件。
修改后内容如下所示
记得退出并保存。
在yarn-site.xml里可以修改与资源管理模块YARN相关的一些配置。
终端中输入 vim yarn-site.xml进行以下更改,将资源调度管理任务放置于master节点上
最终修改后的文件内容如下图所示。
4、mapred-site.xml
进行以下更改,主要添加mapreduce运行历史记录监控端口和网页端口。
同样,在终端输入vim mapred-site.xml开始编辑配置文件,配置内容如下所示
最后保存并退出。
5、slaves
slaves文件指明哪些节点运行DateNode进程,这里我们的集群中运行DataNode进程的节点有slave1、slave2。因此需将这两节点保存到slaves文件中。
在终端中输入 vim slaves命令编辑文件,编辑后的文件内容如下图所示。
最后保存slaves文件并退出编辑。到这里master节点上的hadoop相关配置已经完成了。
接下来我们要通过克隆master及slave1虚拟机来扩展集群。
6、生成slave1节点
通过克隆master 生成slave1节点的过程与之前克隆伪分布节点的操作是一致的这里不再赘述,唯一区别是在执行到下图步骤时注意将虚拟机名称设置为slave1并选择正确的存储位置方便管理。还有一点,被克隆的虚拟机一定要关机状态才可以被克隆。
slave1节点与master节点在hostname、IP地址、Hadoop配置这几个方面是有些差异的,在复制好slave1节点之后需进行配置。
6.1 配置IP地址
在前面文章中提到过slave1节点IP地址应设置为固定的值:192.168.79.12。详细的配置方法步骤已经在配置master节点时介绍过,配置slave1节点时可以参考一下。修改完成后的配置结果如下图所示,点击save保存即可。
6.2、修改hostname
保存并退出
6.3、修改Hadoop配置项
hdfs-site.xml
保存并退出之后重启slave1节点查看配置是否生效。
7、生成slave2节点
Slave2与slave1在Hadoop相关配置内容上是一致的,因此通过克隆slave1节点来生成slave2可以减少一些操作步骤。
克隆slave1节点时的操作步骤同样参考之前文章内容,区别是执行到下图步骤时记得更改虚拟机名称为slave2并更改存储目录(存储目录自己定义)。
7.1、配置IP地址
克隆完成后打开slave2虚拟机并配置其IP地址。配置过程与之前配置master节点IP过程一致,只是IP地址需改为192.168.79.13结果如下图所示,点击save保存即可。
更改Hostname,在终端中输入sudo vim /etc/hostname并回车执行,根据提示输入密码
输入i编辑hostname文件,文件内容如下所示为slave2,然后保存退出。
重启虚拟机测试配置是否生效,重启命令为sudo reboot
slave2重新启动后打开终端,输入命令ifconfig查看IP设置及虚拟机名,如下图所示配置已经生效。
到这里我们的hadoop集群安装配置完成。接下来的文章我会给大家介绍一下hadoop集群如如何启动。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析在当今信息时代发挥着重要作用。单因素方差分析(One-Way ANOVA)是一种关键的统计方法,用于比较三个或更多独立样本组 ...
2025-04-25CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-25在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-24以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《刘静:10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda ...
2025-04-23大咖简介: 刘凯,CDA大咖汇特邀讲师,DAMA中国分会理事,香港金管局特聘数据管理专家,拥有丰富的行业经验。本文将从数据要素 ...
2025-04-22CDA持证人简介 刘伟,美国 NAU 大学计算机信息技术硕士, CDA数据分析师三级持证人,现任职于江苏宝应农商银行数据治理岗。 学 ...
2025-04-21持证人简介:贺渲雯 ,CDA 数据分析师一级持证人,互联网行业数据分析师 今天我将为大家带来一个关于用户私域用户质量数据分析 ...
2025-04-18一、CDA持证人介绍 在数字化浪潮席卷商业领域的当下,数据分析已成为企业发展的关键驱动力。为助力大家深入了解数据分析在电商行 ...
2025-04-17CDA持证人简介:居瑜 ,CDA一级持证人,国企财务经理,13年财务管理运营经验,在数据分析实践方面积累了丰富的行业经验。 一、 ...
2025-04-16持证人简介: CDA持证人刘凌峰,CDA L1持证人,微软认证讲师(MCT)金山办公最有价值专家(KVP),工信部高级项目管理师,拥有 ...
2025-04-15持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。在实际生活中,我们可能会 ...
2025-04-14在 Python 编程学习与实践中,Anaconda 是一款极为重要的工具。它作为一个开源的 Python 发行版本,集成了众多常用的科学计算库 ...
2025-04-14随着大数据时代的深入发展,数据运营成为企业不可或缺的岗位之一。这个职位的核心是通过收集、整理和分析数据,帮助企业做出科 ...
2025-04-11持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。 本次分享我将以教培行业为 ...
2025-04-11近日《2025中国城市长租市场发展蓝皮书》(下称《蓝皮书》)正式发布。《蓝皮书》指出,当前我国城市住房正经历从“增量扩张”向 ...
2025-04-10在数字化时代的浪潮中,数据已经成为企业决策和运营的核心。每一位客户,每一次交易,都承载着丰富的信息和价值。 如何在海量客 ...
2025-04-09数据是数字化的基础。随着工业4.0的推进,企业生产运作过程中的在线数据变得更加丰富;而互联网、新零售等C端应用的丰富多彩,产 ...
2025-04-094月7日,美国关税政策对全球金融市场的冲击仍在肆虐,周一亚市早盘,美股股指、原油期货、加密货币、贵金属等资产齐齐重挫,市场 ...
2025-04-08背景 3月26日,科技圈迎来一则重磅消息,苹果公司宣布向浙江大学捐赠 3000 万元人民币,用于支持编程教育。 这一举措并非偶然, ...
2025-04-07在当今数据驱动的时代,数据分析能力备受青睐,数据分析能力频繁出现在岗位需求的描述中,不分岗位的任职要求中,会特意标出“熟 ...
2025-04-03