作者:丁点helper
来源: 丁点帮你
前面2篇R语言相关的文章以泰坦尼克号的数据为例,介绍了描述性统计中用到的计算操作,以及柱形图的绘制操作。今天我们继续聊聊如何在R中绘制直方图和散点图。
绘制直方图
仍使用titanic.csv这个数据。
# 导入数据 titanic <- read.csv("//Users//Desktop//titanic.csv",header = TRUE) names(titanic) # 查看titanic中的变量名 [1] "pclass" "survived" "sex" "age" "sibsp" "parch"
假设我们想对age这个变量绘制直方图,了解泰坦尼克号上乘客的年龄分布,可用hist()这个函数:
hist(titanic$age)
上图中直方图标题、颜色、坐标轴名称均可调整:
hist(titanic$age, col='orange', main='Passenger Age', lwd=2, xlab='Age (years)')
其中,col、main、xlab这三个命令在之前的文章中讲过;lwd为线条宽度命令,取值须为整数,默认值为1。
绘制散点图
接下来我们看看如何绘制散点图。还是老规矩,要用到的数据可通过以下方式下载:
文件名: wb.csv
链接: https://pan.baidu.com/s/1gOAuccW5i8cIW5HaPHnm8A
密码: nc5u
这是世界银行(word bank)对部分国家社会、经济、环境指标的统计数据。
# 导入数据 wb <- read.csv("//Users//Desktop//wb.csv",header = TRUE) names(wb) # 查看wb中的变量名 [1] "Country" "Code" "Population" "Rural" "GNI" "IncomeTop10" "Imports" [8] "Exports" "Military" "Cell" "Fertility66" "Fertility16" "Measles" "InfMort" [15] "LifeExp" "PM2.5" "Diesel" "CO2" "EnergyUse" "FossilPct" "Forest94" [22] "Forest14" "Deforestation" "GunTotal" "GunHomicide" "GunSuicide" "GunUnint" "GunUndet" [29] "GunsPer100"
这里我们先关注第五个变量『GNI』,其意义是人均国民收入。GNI是Gross National Income的缩写;再关注第18个变量『CO2』,其意义是人均二氧化碳排放量。
一项研究想观察人均国民收入和人均二氧化碳排放量之间存在何种关系,由于二者均为数值型变量,我们可以用散点图的方式直观感受一下:
plot(wb$GNI,wb$CO2, main="CO2 vs. GNI (both per capita)", xlab="Gni per capita", ylab="CO2 per capita", col="red", pch=19) # col命令的取值还可以是数字,本例中red对应的数字是2 plot(wb$GNI,wb$CO2, main="CO2 vs. GNI (both per capita)", xlab="Gni per capita", ylab="CO2 per capita", col=2, pch=19)
上面两条代码的运行结果是一样的。wb$GNI 和 wb$CO2 分别为散点图的横轴和纵轴;pch表示点的形状,取值为整数,本例中用到的19表示圆点。
下面用一个图片来给大家介绍1-20的数字分别代表什么颜色、什么形状:
plot(c(1:20),rep(1,20),col=c(1:20),pch=c(1:20),cex=2)
cex表示对图中的文本或符号放大多少倍,大家可自行在R中操作,感受cex=1时图像的变化。
举个例子,col=15:黄色;pch=15:方块。在R中,可选的颜色还有很多,大家可以查看下图中的颜色名称,绘图时在col命令中输入即可。
手机用户可横屏查看效果更佳,告别大红大蓝秋裤色就靠它了~
今天就学到这里啦,之后还有更多R绘图课程来和大家见面!
——热门课程推荐:
想从事业务型数据分析师,您可以点击>>>“数据分析师”了解课程详情;
想从事大数据分析师,您可以点击>>>“大数据就业”了解课程详情;
想成为人工智能工程师,您可以点击>>>“人工智能就业”了解课程详情;
想了解Python数据分析,您可以点击>>>“Python数据分析师”了解课程详情;
想咨询互联网运营,你可以点击>>>“互联网运营就业班”了解课程详情;
数据分析咨询请扫描二维码
数据分析是一个涉及从数据收集、清理到分析、可视化和解释的复杂过程。随着数据在各行各业中的重要性不断增加,数据分析工具也变 ...
2024-10-066. 方差分析 单因素多水平方差分析 例6.1 不同装配方式对生产的过滤系统数量的差异性检验 某城市过滤水系统生产公司,有A、B、C3 ...
2024-10-06不过,在出题前,要公布上一期LEVEL II中61-65题的答案,大家一起来看! 62、B 64、B 你答对了吗? 66.关于单因素 ...
2024-10-05嗨喽,各位同学又到了公布CDA数据分析师认证考试LEVEL II的模拟试题时间了,今天给大家带来的是模拟试题(一)中的146-150 ...
2024-10-055. 假设检验 久经考场的你肯定对于很多概念类题目里问到的 “区别和联系” 不陌生,与之类似,在统计领域要研究的是数据之间的区 ...
2024-10-05数据模型(Data Model)是对现实世界数据特征的抽象,用于描述一组数据的概念和定义。它从抽象层次上描述了系统的静态特征、动态 ...
2024-10-044. 区间估计 还以为你被上节课的内容唬住了~终于等到你,还好没放弃! 本节我们将说明两个问题:总体均值 的区间估计和总体比例 ...
2024-10-04大数据分析师在现代企业中扮演着至关重要的角色。他们通过分析大量数据,帮助企业做出明智的决策。要成为一名成功的大数据分析师 ...
2024-10-033. 数据分布 t分布、F分布和卡方分布是统计学中常用的三种概率分布,它们分别用于样本均值的推断、方差的比较和数据的拟合优度检 ...
2024-10-03大数据分析师在现代企业中扮演着至关重要的角色。他们通过分析大量数据,帮助企业做出明智的决策。要成为一名成功的大数据分析师 ...
2024-10-022. 描述性统计 上一篇介绍了数据的分类、统计学是什么、以及统计学知识的大分类,本篇我们重点学习描述性统计学。 我们描述一组 ...
2024-10-02大数据专业的毕业生可以选择多种就业方向和岗位,主要集中在数据分析、系统研发和应用开发三大领域。以下是一些具体的岗位: 大 ...
2024-10-011.统计学简介 听说你已经被统计学劝退,被Python唬住……先别着急划走,看完这篇再说! 先说结论,大多数情况下的学不会都不是知 ...
2024-10-01大数据的全球市场规模在 2023 年估计为 1850 亿美元,预计到 2030 年将达到 3834 亿美元,2023 年至 2030 年的复合年增长率为 11 ...
2024-09-30大数据分析是指收集、分析和处理大量数据以发现市场趋势、洞察力和模式,帮助公司做出更好的商业决策的过程。这些信息可以快速、 ...
2024-09-30大数据分析是当今世界一些最重要行业进步背后的推动力,包括医疗、政府和金融等领域。了解更多关于如何处理大数据以及开始时使用 ...
2024-09-30大数据已经成为日常生活不可或缺的一部分,影响着我们的活动。对大量数据的分析已经成为一个重要的行业,对大数据分析师的需求也 ...
2024-09-30数据分析师证书报名官网指南 数据分析师在现代企业中扮演着越来越重要的角色,掌握数据分析技能不仅能够提升个人职场竞争力,也 ...
2024-09-29大数据分析师培训学什么 课程简介 大数据分析师课程以大数据分析技术为主线,以大数据分析师为培养目标,从数据分析基础、linux ...
2024-09-29随着大数据在各行各业中的应用日益广泛,数据分析师这一职业变得越来越重要。作为一名数据分析师,不仅需要具备扎实的技术能力, ...
2024-09-29