—-其他常见的概率分布1—-
dbinom(k,n,m)用于计算二项分布概率
k是发生的次数,n是共次数,p是概率

> dbinom(3,10,0.7)
[1] 0.009001692

卡方分布回顾

R语言 卡方拟合 r语言求卡方分布的概率_分布计算


卡方分布的特征:

R语言 卡方拟合 r语言求卡方分布的概率_二项分布_02


上图可以看出,自由度k值越大,其图像越接近正太分布的图像。

R语言 卡方拟合 r语言求卡方分布的概率_机器学习_03


由上图可知,分布函数可由自由度和卡方值求得,则

自由度和分布函数(面积)可求出卡方值。

其中分布函数(面积)也为不相关的概率,例p=0.05,表示不相关的概率为0.05。

关于自由度–

”自由度“是公式中一个重要参数–k.

自由度不同,图形的形状也完全不同.

自由度为 k 的卡方变量的平均值是 k,方差是 2k.

卡方检验–注意与卡方分布区分!

R语言 卡方拟合 r语言求卡方分布的概率_机器学习_04


其中A为实际值,T为理论值。

我们可以通过卡方值来判断特征是否与类型有关。卡方值越大,说明关联越强,特征越需要保留。卡方值越小,说明越不相关,特征需要去除。

R语言中的卡方分布计算–

dchisq()

> a=rnorm(100)
#自由度为1的卡方分布
> b=dchisq(a,1)

T分布回顾(学生t-分布)

T分布的概率密度函数-f(x)

R语言 卡方拟合 r语言求卡方分布的概率_r语言_05


其图像如下

R语言 卡方拟合 r语言求卡方分布的概率_机器学习_06


如上图,n值越大,曲线越接近于正太分布

T分布的累积分布函数—F(X)

R语言 卡方拟合 r语言求卡方分布的概率_R语言 卡方拟合_07


T分布在R中的使用如下

> a=rnorm(100)
> c=dt(a,1,0)

T检验:

R语言 卡方拟合 r语言求卡方分布的概率_R语言 卡方拟合_08


其中红色圈内为样本均值,如下

R语言 卡方拟合 r语言求卡方分布的概率_分布计算_09


蓝色圈内为样本的标准差,如下图

R语言 卡方拟合 r语言求卡方分布的概率_机器学习_10


注意:黑色圈内的n并不是t的自由度!!t的自由度是(n-1)

t检验

其分为单总体检验和双总体检验,具体我们后面讲解。

好了,今天就到这里吧,我们明天继续介绍哦!!