—-其他常见的概率分布1—-
dbinom(k,n,m)用于计算二项分布概率
k是发生的次数,n是共次数,p是概率
> dbinom(3,10,0.7)
[1] 0.009001692
卡方分布回顾
卡方分布的特征:
上图可以看出,自由度k值越大,其图像越接近正太分布的图像。
由上图可知,分布函数可由自由度和卡方值求得,则
自由度和分布函数(面积)可求出卡方值。
其中分布函数(面积)也为不相关的概率,例p=0.05,表示不相关的概率为0.05。
关于自由度–
”自由度“是公式中一个重要参数–k.
自由度不同,图形的形状也完全不同.
自由度为 k 的卡方变量的平均值是 k,方差是 2k.
卡方检验–注意与卡方分布区分!
其中A为实际值,T为理论值。
我们可以通过卡方值来判断特征是否与类型有关。卡方值越大,说明关联越强,特征越需要保留。卡方值越小,说明越不相关,特征需要去除。
R语言中的卡方分布计算–
dchisq()
> a=rnorm(100)
#自由度为1的卡方分布
> b=dchisq(a,1)
T分布回顾(学生t-分布)
T分布的概率密度函数-f(x)
其图像如下
如上图,n值越大,曲线越接近于正太分布
T分布的累积分布函数—F(X)
T分布在R中的使用如下
> a=rnorm(100)
> c=dt(a,1,0)
T检验:
其中红色圈内为样本均值,如下
蓝色圈内为样本的标准差,如下图
注意:黑色圈内的n并不是t的自由度!!t的自由度是(n-1)
t检验
其分为单总体检验和双总体检验,具体我们后面讲解。
好了,今天就到这里吧,我们明天继续介绍哦!!