
之前的文章中我们已经将master节点的网络IP、hostname文件、hosts文件配置完成,接下来还有hadoop相关配置文件需要修改。今天我们来讲master节点hadoop的配置。
1、hdfs-site.xml
在hadoop的配置文件中与HDFS(hadoop分布式文件系统)相关的是hdfs-core.xml文件。在伪分布集群中只有一个节点,因此此节点即要有NameNode功能也要有DataNode功能。在工作环境中这两个是不会在一个节点上的,在我们的多节点分布式集群中master只运行NameNode因此需在hdfs-site.xml文件中删除DataNode相关配置。
打开虚拟机在终端中输入cd hadoop/etc/hadoop 命令进入hadoop配置文件目录。
终端输入命令vim hdfs-site.xml进入vim编辑界面,按下图步骤删除原来伪分布集群配置的DataNode相关配置,并将数据冗余数量设置为2。
输入i进入编辑模式,编辑后的文件内容如下所示。
最后退出编辑模式,保存并退出。
2、core-site.xml
在core-site.xml中指定一个节点运行hdfs服务。在之前伪分布集群中只有一个节点,因此我们使用的是localhost,如今在集群中有三个节点,我们约定使用master。
在终端中输入vim core-site.xml按下图操作修改配置文件。
修改后内容如下所示
记得退出并保存。
在yarn-site.xml里可以修改与资源管理模块YARN相关的一些配置。
终端中输入 vim yarn-site.xml进行以下更改,将资源调度管理任务放置于master节点上
最终修改后的文件内容如下图所示。
4、mapred-site.xml
进行以下更改,主要添加mapreduce运行历史记录监控端口和网页端口。
同样,在终端输入vim mapred-site.xml开始编辑配置文件,配置内容如下所示
最后保存并退出。
5、slaves
slaves文件指明哪些节点运行DateNode进程,这里我们的集群中运行DataNode进程的节点有slave1、slave2。因此需将这两节点保存到slaves文件中。
在终端中输入 vim slaves命令编辑文件,编辑后的文件内容如下图所示。
最后保存slaves文件并退出编辑。到这里master节点上的hadoop相关配置已经完成了。
接下来我们要通过克隆master及slave1虚拟机来扩展集群。
6、生成slave1节点
通过克隆master 生成slave1节点的过程与之前克隆伪分布节点的操作是一致的这里不再赘述,唯一区别是在执行到下图步骤时注意将虚拟机名称设置为slave1并选择正确的存储位置方便管理。还有一点,被克隆的虚拟机一定要关机状态才可以被克隆。
slave1节点与master节点在hostname、IP地址、Hadoop配置这几个方面是有些差异的,在复制好slave1节点之后需进行配置。
6.1 配置IP地址
在前面文章中提到过slave1节点IP地址应设置为固定的值:192.168.79.12。详细的配置方法步骤已经在配置master节点时介绍过,配置slave1节点时可以参考一下。修改完成后的配置结果如下图所示,点击save保存即可。
6.2、修改hostname
保存并退出
6.3、修改Hadoop配置项
hdfs-site.xml
保存并退出之后重启slave1节点查看配置是否生效。
7、生成slave2节点
Slave2与slave1在Hadoop相关配置内容上是一致的,因此通过克隆slave1节点来生成slave2可以减少一些操作步骤。
克隆slave1节点时的操作步骤同样参考之前文章内容,区别是执行到下图步骤时记得更改虚拟机名称为slave2并更改存储目录(存储目录自己定义)。
7.1、配置IP地址
克隆完成后打开slave2虚拟机并配置其IP地址。配置过程与之前配置master节点IP过程一致,只是IP地址需改为192.168.79.13结果如下图所示,点击save保存即可。
更改Hostname,在终端中输入sudo vim /etc/hostname并回车执行,根据提示输入密码
输入i编辑hostname文件,文件内容如下所示为slave2,然后保存退出。
重启虚拟机测试配置是否生效,重启命令为sudo reboot
slave2重新启动后打开终端,输入命令ifconfig查看IP设置及虚拟机名,如下图所示配置已经生效。
到这里我们的hadoop集群安装配置完成。接下来的文章我会给大家介绍一下hadoop集群如如何启动。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
LSTM 模型输入长度选择技巧:提升序列建模效能的关键 在循环神经网络(RNN)家族中,长短期记忆网络(LSTM)凭借其解决长序列 ...
2025-07-11CDA 数据分析师报考条件详解与准备指南 在数据驱动决策的时代浪潮下,CDA 数据分析师认证愈发受到瞩目,成为众多有志投身数 ...
2025-07-11数据透视表中两列相乘合计的实用指南 在数据分析的日常工作中,数据透视表凭借其强大的数据汇总和分析功能,成为了 Excel 用户 ...
2025-07-11尊敬的考生: 您好! 我们诚挚通知您,CDA Level I和 Level II考试大纲将于 2025年7月25日 实施重大更新。 此次更新旨在确保认 ...
2025-07-10BI 大数据分析师:连接数据与业务的价值转化者 在大数据与商业智能(Business Intelligence,简称 BI)深度融合的时代,BI ...
2025-07-10SQL 在预测分析中的应用:从数据查询到趋势预判 在数据驱动决策的时代,预测分析作为挖掘数据潜在价值的核心手段,正被广泛 ...
2025-07-10数据查询结束后:分析师的收尾工作与价值深化 在数据分析的全流程中,“query end”(查询结束)并非工作的终点,而是将数 ...
2025-07-10CDA 数据分析师考试:从报考到取证的全攻略 在数字经济蓬勃发展的今天,数据分析师已成为各行业争抢的核心人才,而 CDA(Certi ...
2025-07-09【CDA干货】单样本趋势性检验:捕捉数据背后的时间轨迹 在数据分析的版图中,单样本趋势性检验如同一位耐心的侦探,专注于从单 ...
2025-07-09year_month数据类型:时间维度的精准切片 在数据的世界里,时间是最不可或缺的维度之一,而year_month数据类型就像一把精准 ...
2025-07-09CDA 备考干货:Python 在数据分析中的核心应用与实战技巧 在 CDA 数据分析师认证考试中,Python 作为数据处理与分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 检验:数据趋势与突变分析的有力工具 在数据分析的广袤领域中,准确捕捉数据的趋势变化以及识别 ...
2025-07-08备战 CDA 数据分析师考试:需要多久?如何规划? CDA(Certified Data Analyst)数据分析师认证作为国内权威的数据分析能力认证 ...
2025-07-08LSTM 输出不确定的成因、影响与应对策略 长短期记忆网络(LSTM)作为循环神经网络(RNN)的一种变体,凭借独特的门控机制,在 ...
2025-07-07统计学方法在市场调研数据中的深度应用 市场调研是企业洞察市场动态、了解消费者需求的重要途径,而统计学方法则是市场调研数 ...
2025-07-07CDA数据分析师证书考试全攻略 在数字化浪潮席卷全球的当下,数据已成为企业决策、行业发展的核心驱动力,数据分析师也因此成为 ...
2025-07-07剖析 CDA 数据分析师考试题型:解锁高效备考与答题策略 CDA(Certified Data Analyst)数据分析师考试作为衡量数据专业能力的 ...
2025-07-04SQL Server 字符串截取转日期:解锁数据处理的关键技能 在数据处理与分析工作中,数据格式的规范性是保证后续分析准确性的基础 ...
2025-07-04CDA 数据分析师视角:从数据迷雾中探寻商业真相 在数字化浪潮席卷全球的今天,数据已成为企业决策的核心驱动力,CDA(Certifie ...
2025-07-04CDA 数据分析师:开启数据职业发展新征程 在数据成为核心生产要素的今天,数据分析师的职业价值愈发凸显。CDA(Certified D ...
2025-07-03