京公网安备 11010802034615号
经营许可证编号:京B2-20210330
hadoop是使用Java语言开发的并且Hadoop运行需要有Java环境的支持,因此在安装hadoop之前需要安装Java开发环境即JDK(Java Development Kit)。安装前首先向大家介绍以一下本文会用到的几个词:
JAVA_HOME:
一是为了方便引用,比如,JDK安装在/usr/lib/jvm/java-7-openjdk-i386目录里,则设置JAVA_HOME为该目录路径, 那么以后要使用这个路径的时候, 只需输入$JAVA_HOME即可, 避免每次引用都输入很长的路径串;
二则是归一原则, 当JDK路径改变的时候, 仅需更改JAVA_HOME的变量值即可, 否则,就要更改任何用绝对路径引用JDK目录的文档, 要是万一没有改全, 某个程序找不到JDK, 后果是可想而知的----系统崩溃!
三则是第三方软件会引用约定好的 JAVA_HOME 变量, 不然, 你不能正常使用该软件。
path 变量
path 变量使得我们能够在系统中的任何地方运行java等应用程序,比如 javac、java、javah 等等,这就要找到我们安装JDK 的目录,
假设我们的JDK安装在/usr/lib/jvm/java-7-openjdk-i386 目录下,那么在 /usr/lib/jvm/java-7-openjdk-i386/bin目录下就是我们常用的 java 应用程序,我们就需要把 这个目录加到 path 环境变量里面。
classpath 变量
classpath 环境变量,是当我们在开发java程序时需要引用别人写好的类时,要让 java 解释器知道到哪里去找这个类。通常,sun 为我们提供了一些额外的丰富的类包,一个是 dt.jar,一个是 tools.jar,这两个 jar 包都位于 /usr/lib/jvm/java-7-openjdk-i386\lib 目录下,所以通常我们都会把这两个 jar 包加到我们的 classpath 环境变量中。
JRE(Java Runtime Enviroment) 是 Java 的运行环境。面向 Java 程序的使用者,而不是开发者。如果你仅下载并安装了JRE,那么你的系统只能运行 Java 程序。JRE 是运行Java 程序所必须环境的集合,包含JVM标准实现及 Java核心类库。它包括 Java 虚拟机、Java 平台核心类和支持文件。它不包含开发工具(编译器、调试器等)。
JDK(Java Development Kit) 又称 J2SDK(Java2 Software Development Kit),是 Java 开发工具包,它提供了 Java 的开发环境(提供了编译器javac 等工具,用于将 java 文件编译为 class 文件)和运行环境(提 供了 JVM 和 Runtime 辅助包,用于解析 class 文件使其得到运行)。如果你下载并安装了 JDK,那么你不仅可以开发 Java 程序,也同时拥有了运行 Java 程序的平台。JDK 是整个 Java 的核心,包括了Java运行环境(JRE),一堆 Java 工具 tools.jar 和 Java 标准类库 (rt.jar)。
1、JDK安装方式及版本介绍
JDK在Ubuntu下的常用安装方式有两种:一种是使用apt-get等类似软件包管理工具在线安装,另一种方式为离线安装:将编译好的软件代码先下载然后安装。JDK的版本有许多,常用的是jdk1.7、jdk1.8,为了简化安装过程我们本次采用apt-get在线方式安装jdk1.7版本。
2、安装
首先启动ubuntu系统的终端,然后在终端中输入java -version来查看系统是否已安装jdk。结果如下图所示,未安装jdk。
在Linux中既可以使用apt进行软件包管理,也可以使用apt-get下载安装软件包。
为了获得最新软件包版本,我们使用apt-get安装jdk之前需先执行apt-get update来更新软件源信息。
执行apt-get 命令需要较高的权限,因此命令前需加sudo命令
sudo apt-get update
经过一段时间的更新与下载之后,软件源信息更新完成。
下面开始安装JDK,安装jdk的命令为:sudo apt-get install default-jdk。
软件下载、安装需要一定的空间,安装程序会提示是否继续执行,输入Y然后按回车键即可。
软件下载及安装需要一定时间,耐心等待即可无需其他操作。执行到下图出现done表示已经完成安装。
此时可以通过执行java -version命令查看JDK安装版本。
3、系统环境变量配置
有些软件运行需要用到系统变量JAVA_HOME CLASS_PATH因此我们还需要讲安装好的JDK进行配置。首先可以通过命令sudo find / -name javac来查找jdk的安装位置。如下图所示jdk的安装位置为:/usr/lib/jvm/java-7-openjdk-i386
我们可以通过ls命令查看jdk下面都有哪些文件,如下图所示jdk下面有bin、jre、lib等文件目录,其中bin目录下有java常用开发编译工具如javac等,而jre/bin下有java程序的运行环境如java程序等。lib目录在文章开始的时候也提到了,里面有java开发常用的类库。
我们执行cd命令可以直接回到用户主目录下
接下来我们配置一下环境变量,在用户主目录下执行 vim ./bashrc,在该文件中输入下图信息并保存。
刷新一下系统配置文件,使用命令source ./bashrc
我们可以通过命令:echo 变量名 方式查看配置的环境变量是否成功。
如上图所示,显示的信息与我们实际配置是一致的,jdk安装完成。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、市场研究、用户画像构建、学术研究等场景中,我们常常会遇到多维度、多指标的数据难题:比如调研用户消费行为时,收 ...
2026-03-25在流量红利见顶、获客成本持续攀升的当下,营销正从“广撒网”的经验主义,转向“精耕细作”的数据驱动主义。数据不再是营销的辅 ...
2026-03-25在CDA(Certified Data Analyst)数据分析师的全流程工作中,无论是前期的数据探索、影响因素排查,还是中期的特征筛选、模型搭 ...
2026-03-25在当下数据驱动决策的职场环境中,A/B测试早已成为互联网产品、运营、营销乃至产品迭代优化的核心手段,小到一个按钮的颜色、文 ...
2026-03-24在统计学数据分析中,尤其是分类数据的分析场景里,卡方检验和显著性检验是两个高频出现的概念,很多初学者甚至有一定统计基础的 ...
2026-03-24在CDA(Certified Data Analyst)数据分析师的日常业务分析与统计建模工作中,多组数据差异对比是高频且核心的分析场景。比如验 ...
2026-03-24日常用Excel做数据管理、台账维护、报表整理时,添加备注列是高频操作——用来标注异常、说明业务背景、记录处理进度、补充关键 ...
2026-03-23作为业内主流的自助式数据可视化工具,Tableau凭借拖拽式操作、强大的数据联动能力、灵活的仪表板搭建,成为数据分析师、业务人 ...
2026-03-23在CDA(Certified Data Analyst)数据分析师的日常工作与认证考核中,分类变量的关联分析是高频核心场景。用户性别是否影响商品 ...
2026-03-23在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17