R语言提供了计算典型分布的分布函数、分布律或概率密度函数,以及分布函数的反函数的各种函数。
例如、考虑正态分布,设μ是均值,σ^2是方差,对于任意的变量x,其分布函数为:
pnorm(x,μ ,σ )
对应的概率密度函数为:
dnorm(x,μ ,σ )
计算标准正态分布上α/2(α =0.05)分位点,其计算公式为:
qnorm(1-0.025,0,1) = 1.959964
产生100个标准正态分布的随机数:
r<-rnorm(100,0,1)
关于正态分布函数dnorm()、pnorm()、qnorm()和rnorm()的使用方法如下:
其中x、q是由数值型变量构成的向量,p是由概率构成的向量。n是产生随机数的个数,mean是要计算的正态分布的均值,缺省值为0,sd是你的正态分布的标准差,缺省值为1,函数dnorm()的返回值是正态分布的概率密度函数,函数pnorm()的返回值是正态分布的分布函数,函数qnorm()的返回值是给定概率p后的下分位点,函数rnorm()的返回值是由n个正态分布随机数构成的向量。
log、log.p是逻辑变量,当它为TRUE时,函数的返回值不再是正态分布,而是对数正态分布。lower.tail是逻辑变量,当它为TRUE是,分布函数的计算公式为:F(x)=P(X<=x);当它为FALSE时,分布函数的计算公式为:F(x)=P(X>x)
再看一个离散随机变量计算函数的例子:泊松分布。回顾请看《每天一点统计学——泊松分布公式在生活中的应用》在这里先简单回顾一下泊松分布的基础知识:
泊松概率分布是考虑在连续时间和空间单位上发生的随机事件的概率。通俗解释:基于过去的经验,预测该随机事件在新的同样长的时间或同样大的空间中发生N次的概率。
泊松分布的使用格式为:
其中dpois()是泊松分布概率密度函数,ppois()是分布函数,qpois()函数用于计算给定分位点,rpois()用于产生泊松分布的向量。
除此之外,R语言还提供了其他常见的分布函数;
在上图所示各种分布中,加上不同的前缀表示不同的意义:
d——概率密度函数f(x);
p——分布函数F(x);
q——分布函数的反函数,即给定概率p后,求其下分位点;
r——产生相同分布的随机数