用R语言求概率分布_r语言概率分布图-CDA数据分析师官网

热线电话：13121318867

用R语言求概率分布_r语言概率分布图

2016-12-11

用R语言求概率分布_r语言概率分布图

R语言一个很方便的用处是提供了一套完整的统计表集合。函数可以对累积分布函数P(X≤x)，概率密度函数，分位函数（对给定的q，求满足P(X≤x) > q的最小x）求值，并根据分布进行模拟。

在R中，根据某种分布生成随机序列的函数如下：

在统计学中，产生随机数据是很有用的，R可以产生多种不同分布下的随机数序列。这些分布函数的形式为rfunc(n,p1,p2,…)，其中func指概率分布函数，n为生成数据的个数，p1, p2, . . .是分布的参数数值。上面的表给出了每个分布的详情和可能的缺省值（如果没有给出缺省值，则意味着用户必须指定参数）。数据分析培训

例：用0~1之间的均匀分布产生10个随机点

> runif(10)

[1] 0.961465376 0.007521925 0.193619234 0.137027246 0.739370654 0.072907082

[7] 0.674551635 0.650777811 0.984664183 0.796723066

大多数这种统计函数都有相似的形式，只需用d、p或者q去替代r，比如密度函数(dfunc(x, …))，累计概率密度函数（也即分布函数）(pfunc(x,…))和分位数函数(qfunc(p, …)，0<p<1)。最后两个函数序列可以用来求统计假设检验中P值或临界值。例如，显著性水平为5%的正态分布的双侧临界值是：

> qnorm(0.025)

[1] -1.959964

> qnorm(0.975)

[1] 1.959964

对于同一个检验的单侧临界值，根据备择假设的形式使用qnorm(0.05)或1 – qnorm(0.95)。

下面是一些用R语言求解概率问题的例子：

1. 某人进行射击，每次击中目标的命中率为0.02，独立射击400次，求至少击中两次的概率。

解：400重伯努利试验，用二项分布求解。

P{X = k} = C400k * (0.02)^k * (0.0=98)^(400-k)

P{X≥2} = 1 – P{X = 0} – P{X = 1}

> 1 – sum(pbinom(0:1, 400, 0.02))

[1] 0.9968561

结论：决不能轻视小概率事情，在多次重复试验的情况下，这一事件的发生几乎是肯定的。

2. 设X服从平均值为1，标准差为2的正态分布（高斯分布），即X ~ N(1, 4)，求P{0<X≤1.6}

解：这里X是一个连续型随机变量。求X在某段区间上的概率，用X的分布函数在区间两端的值的差。

方法一：P{0<X≤1.6} = P{X≤1.6} – P{X≤0} = F(1.6) – F(0)

> pnorm(1.6, 1, 2) – pnorm(0, 1, 2)

[1] 0.3093739

方法二：转化为标准正态分布。P{x1 < X ≤x2}=P{(x1-μ)/σ < (X-μ)/σ≤(x1-μ)/σ}=φ((x2-μ)/σ) –φ((x1-μ)/σ)

即P{0<X≤1.6}=φ((1.6-1)/2) –φ((0-1)/2)

> pnorm((1.6-1)/2) – pnorm((0-1)/2) #pnorm函数的缺省参数mean=0,sd=1，即默认标准正态分布

[1] 0.3093739

知识点：设X是一个随机变量，x是任意实数，函数F(x)=P{X≤x}称为X的分布函数。

对于任意实数x1,x2(x1＜x2),有P{x1＜X≤x2}=P{X≤x2}-P{X≤x1}=F(x2)-F(x1),

因此，若已知X的分布函数，就可以知道X落在任一区间(x1,x2]上的概率，在这个意义上说，分布函数完整地描述了随机变量的统计规律性。

分布函数是一个普遍的函数，正是通过它，我们将能用数学分析的方法来研究随机变量。

如果将X看成是数轴上的随机点的坐标，那么，分布函数F(x)在x处的函数值就表示X落在区间(-∞,x]上的概率。

3. 求标准正态分布的上α分位点。

知识点：设X~N(0,1)，若Zα满足条件 P(X>Zα)=α，0<α<1，则称Zα为标准正态分布的上α分位点.

注意上α分位点和R语言中分位函数（对给定的q，求满足P(X≤x) > q的最小x）之间的关系。

解：下面给出α=0.001、α=0.005、α=0.01、α=0.025时的上α分位点Zα的值。

> exp <- expression_r(qnorm(1 – alpha))

> alpha = 0.001

> eval_r(exp)

[1] 3.090232

> alpha = 0.005

> eval_r(exp)

[1] 2.575829

> alpha = 0.01

> eval_r(exp)

[1] 2.326348

> alpha = 0.025

> eval_r(exp)

[1] 1.959964

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

正态分布 R语言假设检验数据分析

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇图论在大数据分析中的作用！

下一篇CDA认证再升一档！与国家共同推进大数据人才培养标准教育事业！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

用R语言求概率分布_r语言概率分布图

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】详解B+树叶子节点指针：双向还是单向？ ...

【CDA干货】警惕！REPLACE(UUID(), '-', '')用于INS ...

CDA数据分析师与商业数据分析总体流程：全链路实操 ...

【CDA干货】通过标准差与平均值关系衡量数据波动性 ...

【CDA干货】基于GB标准的t检验、F检验与显著性差异 ...

CDA数据分析师与统计制图：以可视化赋能数据叙事与 ...

【CDA干货】箱线图上下限在线计算：原理、工具与实 ...

【CDA干货】多重共线性下的变量保留策略：平衡信息 ...

CDA数据分析师与六种核心分析方法：从工具到价值的 ...

【CDA干货】特征重要性分析：从模型到业务的核心决 ...

【CDA干货】关联分析之支持度：核心指标的本质、应 ...

CDA数据分析师与数据分析基础范式：方法论落地与价 ...

【CDA干货】巧用AI生成SQL语句：基于数据库字典的精 ...

【CDA干货】支持向量机处理非线性问题：核技巧的原 ...

数据分析与CDA数据分析师：核心概念与价值逻辑 ...

【CDA干货】数据分析指标选取：从原则到场景的实操 ...

【CDA干货】MySQL核心逻辑：为何SELECT在ORDER BY前 ...

CDA数据分析师：企业数字化转型的核心引擎与价值抓 ...

〖提高职业含金量〗数据分析师认证考核！ ...

【CDA干货】数据模型：连接业务与数据的核心逻辑框 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

用R语言求概率分布_r语言 概率分布图

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】详解B+树叶子节点指针：双向还是单向？ ...

【CDA干货】警惕！REPLACE(UUID(), '-', '')用于INS ...

CDA数据分析师与商业数据分析总体流程：全链路实操 ...

【CDA干货】通过标准差与平均值关系衡量数据波动性 ...

【CDA干货】基于GB标准的t检验、F检验与显著性差异 ...

CDA数据分析师与统计制图：以可视化赋能数据叙事与 ...

【CDA干货】箱线图上下限在线计算：原理、工具与实 ...

【CDA干货】多重共线性下的变量保留策略：平衡信息 ...

CDA数据分析师与六种核心分析方法：从工具到价值的 ...

【CDA干货】特征重要性分析：从模型到业务的核心决 ...

【CDA干货】关联分析之支持度：核心指标的本质、应 ...

CDA数据分析师与数据分析基础范式：方法论落地与价 ...

【CDA干货】巧用AI生成SQL语句：基于数据库字典的精 ...

【CDA干货】支持向量机处理非线性问题：核技巧的原 ...

数据分析与CDA数据分析师：核心概念与价值逻辑 ...

【CDA干货】数据分析指标选取：从原则到场景的实操 ...

【CDA干货】MySQL核心逻辑：为何SELECT在ORDER BY前 ...

CDA数据分析师：企业数字化转型的核心引擎与价值抓 ...

〖提高职业含金量〗数据分析师认证考核！ ...

【CDA干货】数据模型：连接业务与数据的核心逻辑框 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

用R语言求概率分布_r语言概率分布图