京公网安备 11010802034615号
经营许可证编号:京B2-20210330
R语言的一个小范例:数值模拟和绘图_数据分析师培训
下午上课,要给经济工程专业的本科生简要介绍一下用于统计分析和绘图的R语言。考虑到他们所在的年级并没有系统的学完统计学和计量经济学,打算不从回归分析入手,先教他们对R的基本操作有个了解。写了如下这段代码,准备课上带同学们做一下。顺便发到网上,供大家参考。
背景:
假定是一个由
决定的量,满足关系
问在
的取值空间内,
值的走势如何,以及最大值出现在什么地方,并绘图说明。
talk is cheap. show me the code (废话少说,放码过来)
一点一点写,并适当做说明
qiu <- function(alpha){(alpha / (1-alpha))^{-alpha}}
这段代码的意思是,定义一个名为qiu的function,输入值alpha之后,会自动求得对应的值。比如
> qiu(0.67)
[1] 0.622206
现在我们来搞alpha。
x <- seq(0.001,0.99, by=0.001)
定义一个数组x,取值从0.01开始,每次增加0.001单位,直到0.999。然后看看x这个数组的情况吧
x
length(x)
结果就不贴出来了。现在,把x的值交给qiu来处理,生成的一系列值,我们定义为y。
y <- qiu(x)
画个草图来看看分布情况如何
plot(y~x)
显然,随着x从0到1, y并不是单调变化的:先增大,后减小。那么,y的最高值是多少?对应的x值是多大?
max(y)
x[which.max(y)]
第一行告诉你y的最大值1.3211
第二行的which.max(y)告诉你当y值最大时,所对应的编号是218。把218带入x中,找到对应的x的值:x[218]=0.218
schx=c(x[which.max(y)])
schy=c(max(y))
分别将y值最大时的x和y值,定义为schx和schy,供下文使用。
重新画张图,前面那张太丑了
dev.off()
plot(y~x, ylim=c(0,1.5), xlim=c(0,1), type="l", ylab=expression(beta), xlab=expression(alpha))
第一行dev.off()告诉R的绘图程序,关闭此前的图。第二行的ylim和xlim定义x和y轴的取值范围。type是告诉plot程序,散点图以line的形式呈现。ylab和xlab是x和y轴的名称:由于我们需要使用希腊字母,因此需要使用expression(alpha)和expression(beta)来打出与
。
比原来那张图看着帅一些了是吧。继续调整。
par(new=TRUE)
plot(max(y)~x[which.max(y)], pch=2, lty=3, col="red",ylim=c(0,1.5), xlim=c(0,1), ylab="", xlab="")
第一行告诉绘图程序,我下面要在原有那张图的基础上,继续添加内容,不要覆盖原图。
第二行中,把y最大值时的点标出来,pch表示这个点的形状(1是空心圆,2是空心三角,等等,你们自己试试看从1到20吧)。col="red",将这个点画成红色。ylab和xlab设为空,ylim和xlim和上文的值相同,使得两张图x轴、y轴重合。
差不多行了。如果你想继续和我一样骚包一点的话,跟我向下继续设置。
text(schx, schy-0.2, substitute(paste("(", xx ,", ", yy, ")"), list(xx=schx,yy=schy)))
这行代码的作用是,在途中加入一段文字。语法text(a,b,c)的意思是,a代表横坐标的位置,b代表纵坐标的位置,c代表所需要加入的语言。a和b加在一起,告诉plot()需要把一段文字c放在(a,b)这个地方。
c需要做进一步的说明。"(", 以及 ")", 表示这其中是有纯文字部分的,plot()直接把它们打出来即可(注意逗号是要保留的)。加在两个小括号中间的是xx和yy,这是两个值。
substitute(paste(),list()):
substitute()中包括两部分,一部分是paste(),一部分是list()。paste告诉plot()要加入这段东西了,其中包括两个待赋值的xx和yy。list()为它们分别赋值。
看看效果吧。
看起来还可以。要是能把 这个式子也写上去就更完美了。
text(0.4, 0.5,
substitute(
paste(beta == (frac(alpha, 1-alpha))^{-alpha},
",",
"0<", alpha, "<1")
)
)
收工。这张图看起来还是有些难看。。。。不过基本信息都已经有了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09