R中的功能主要是以函数的形式实现。使用者可以修改(重载)这些函数,也可以开发新的函数。 R有很多package,实现各种功能,可以在R的站点cran中下载安装各种package以扩展功能。
统计学术思想R案例网络收集和介绍
作者:樊瑞珍
文章来源:统计建模与R软件
名称:卡方检验
目标描述:卡方检验在R语言中的运用(案例)
卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,卡方值越大,越不符合;卡方值越小,偏差越小,越趋于符合,若两个值完全相等时,卡方值就为0,表明理论值完全符合。
R语言下进行分层卡方检验方法和过程如下:
t.test t检验
wilcox.test wilcox检验
prop.test
binom.test 贝努力试验检验
chisq.test 卡方检验
fish.test fisher精确检验
ks.test 科尔莫哥罗夫-斯米尔诺夫检验
shapiro.test shapio-wilk正态分布检验
pp.test. phillips-perron检验
quada.test quade检验
friedman.test friedman秩和检验
R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。
R语言 卡方检验
预览:
3、t.test(x,y) 表示对两个变量x,y做两样本均数的成组t检验
4、t.test(x~group) 表示group为分组变量,x为数值变量,做t检验,此时x和y应该在同一个数据集中。
5、 t.test(x[group==1],x[group==2]) 表示对group=1和2时的x做t检验 方差分析:利用lm()函数
如果一个数据集dd中,x是数值变量,g是分组变量,运行:lm(dd$x~dd$g) ,这样实际是拟合一个线性模型,x为应变量,g为自变量。缺省的输出很少,只有g和截据的系数,采用summary()函数可以输出较多信息。即:summary(lm(dd$x~dd$g)) 这样将会输出常见方差分析所需要输出的全部信息,诸位一试便知。
这里提示了R的一个特性:缺省的输出往往是很少的,其实有很多的结果被保存在背后,需要用语句提取出来的。
秩和检验: wilcox.test()函数和kruskal.test()函数
wilcox.test(x) 表示对x做均数为0的符号秩和检验
kruskal.test(x,g) 表示x为数值变量而g为分组变量,做秩和检验
卡方检验:chisq.test()
对于如下四格表资料:12 5
24 11
首先建立四格表:matrix(c(12,24,5,11),crow=2)->data
说明:data中存储了四格表资料,也就是一个矩阵。c(12,24,5,11)是一个向量,crow=2表示有两行,请注意行列的顺序:即先排“列”数据,再排“行”数据。
然后进行卡方检验:chisq.test(data)
对于四格表卡方,缺省的用Yates连续性校正。如果用:chisq.test(data,correct=FLASE),则不进行Yates校正。如果理论数过小,则输出时会提示卡方检验可能不正确,此时就需要用fisher精确概率法:fisher.test(data)。
线性相关
采用cor()函数可以计算两变量的线性相关系数;采用cor.test()函数可以计算相关系数比进行假设检验、提供相关系数可信区间。
例如:c(12,15,13,16,21,22,14)->x
c(25,56,45,15,32,16,45)->y
cor.test(x,y) 即可对x和y进行线性相关分析,计算两者的相关系数并进行假设检验。 线性回归:
lm()函数可以拟合一般线性模型。例如:lm(y~x+z) 便是拟合应变量为y,自变量为x和z的回归方程。直接使用lm(y~x+z) 只能输出x和z的回归系数,用summary(lm(y~x+z)),即外部套上summary函数,可以输出线性回归分析的大部分内容。summary(lm(y~x+z+x*z)) 则是考虑了x和z的交互作用了。
结
R中能够实现各种常用统计分析,这,一般成熟的统计软件都是具有的。
R,作为s+的一个克隆,其实是S语言的一个编程环境。
R中一切都是对象。
R中的功能主要是以函数的形式实现。使用者可以修改(重载)这些函数,也可以开发新的函数。 R有很多package,实现各种功能,可以在R的站点cran中下载安装各种package以扩展功能。
案例:
R软件入门教程---卡方检验
使用chisq.test方法)
如资料如下:
A B
甲 15 12
乙 23 12
丙 24 21
程序如下:
matrix(c(15,23,24,12,12,21),nc=2)->x ―――――――建立两维表nc指列数
chisq.test(x,correct=TRUE) ――――――――――――correct表示是否矫正
结果如下:
Pearson's Chi-squared test
data: x
X-squared = 1.3229, df = 2, p-value = 0.5161
这是师生共同努力的尝试,迭代进化,每天改进一点点.不经意间完成巨大的跨越. 我们关注数据科学, 我们寻找投资机会 我们研究就业岗位 我们关注资讯,我们更关注思想 世界正在加速飞奔 未来呼啸而来!