–参考书籍《R语言实战》 目录 1:描述性统计分析函数 //就是最大最小值等等数据 此处 stat.desc()函数 2:分组描述统计分析数据 //by() 3:列联表和频数表 //table()等可视化列表 4:独立性检验 //检验数据间是否关系(或变量是否独立) 5:相关性检验 //得到变量间的相关(影响)程度 6:组间差异检验 //t检验 非独立性检验 1 2:描述性统计分析函数 ①:此处仅
转载
2023-06-25 15:20:36
401阅读
x = c ( 1, 2, 3, 4 )
x
class ( x ) x1 = as.integer ( x )
转载
2023-11-27 07:45:30
130阅读
4. 因子 因子提供一种简单而又紧凑的形式来处理分类数据。因子用level来表示所有可能的取值。对于数据集中取值个数固定的分类数据,因子特别有用,图形函数和汇总函数就充分利用了因子这种优点。 R软件内部以数值编码方式来存储因子值,这
转载
2023-06-25 15:24:18
178阅读
limma 包的normalizeBetweenArrays和其他数据矫正方法2.normalizeBetweenArrays只能是在同一个数据集里面用来去除样本的差异,不同数据集需要用limma 的 removeBatchEffect函数 去除批次效应数据矫正前.png可以看到,肿瘤样品的表达量整体就比正常对照样品的表达量高出一大截,这样的数据进行后续分析,就会出现大量的上调
转载
2023-09-21 10:22:37
2004阅读
这里总结一下,今天老师上课的内容。我觉得跟着老师,我能学到好多东西。我要消化。我突然觉得自己很卑微,因为有那么多东西需要学习的。但是 复习的侧重点在:什么是自己知道的?什么是自己不知道的?缺什么补什么?R基础知识整理(查漏补缺)S1:identicalidentical(a,i) #既检验数值又检验数据类型
i==m== 仅仅是数值的比较;identical 则同时包括数值和属性的比较;S2: s
转载
2023-09-08 23:08:28
206阅读
R的基本运算a = c(1,2,3,4)
b = c(3,4,5,6)
print(a + b)
print(a ^ b) # a ** b
print(a %% b) # 整除取余
print(a %/% b) # 整除
v <- a # 向左赋值
b -> w # 向右赋值
ls() # 列出所有变量
print( 1 %in% v) # 相当于 in
print
转载
2023-07-09 17:37:54
134阅读
工作空间函数名称功能getwd()/dir.create()显示/创建当前目录setwd("dir")设置当前目录savehistory("file")/loadhistory("file")保存/读取历史命令save.image("file")/load("file")保存/读取工作空间输入输出执行脚本 source("file")
文本输出 sink("file") e.g sink("out
转载
2023-07-21 20:28:01
184阅读
聊一聊R的基本绘图参数
砍柴问樵夫 R语言除了具有优秀的数据处理能力外,对于数据的展现也具有极其灵活和强大的作用。 R语言绘图函数主要包括:低级绘图函数,高级绘图函数,扩展绘图包函数。 基本绘图参数。 我们浏览一下R语言中的基本图形参数。 pch:点的符号,指定绘制点时使用的符号。x<-rep(1:5,times=6)
y<-rep(1:6,each=5)
pl
转载
2023-10-25 22:02:31
307阅读
mega 2560板子在3d打印机中相当于大脑,控制这所有的3d打印配件来完成复杂的打印工作,但mega2560不能直接使用,需要上传(upload)固件(firmware)才可以使用。 1、下载固件——Marlin由于Marlin固件的强大功能和简单易用,所以这里暂时只介绍Marlin固件。Marlin原版下载地址(很多参数都需要自己配置):我自己配置的Marlin固件大部分参数已经改好:htt
转载
2023-12-20 22:13:39
113阅读
R语言与统计分析之 探索性数据分析篇 一、R语言中的统计概念 1、随机实验: 可在相同 2、随机事件 均值u:这个很好理解 R函数:mean中位数:对序列排序后,排在中间的数,需要特别注意的是如果序列为偶数,中位数是中间两个数平均值. R函数:median百分位数:也是顺序统计量,设百分数为p,n是样本个数,则p位数指:np为小数,ceiling(np)+1,np为整数,则p位数:(x
转载
2023-10-30 21:26:24
51阅读
数据的分布特征:分布的集中趋势,反应各数据向其中心值靠拢或聚集的程度(平均数,中位数,四分位数,众数)分布的离散程度,反应各数据远离其中心值的趋势(极差,四分位差,方差,标准差,离散系数)分布的形状,反应数据分布的偏斜程度和峰度(偏态系数,峰度系数)#######################平均数(均值):一组数据相加后除以数据的个数而得到结果,称为平均数(mean)中位数:一组数据排序后处于
转载
2023-06-25 15:23:03
266阅读
apply() 函数算是R语言中很基础的一个函数,同时还有 sapply() lapply() tapply() 函数精简了 apply() 函数的用法。apply() 函数是一个很R语言的函数,可以起到很好的替代冗余的for循环的作用,R语言中的循环操作for和while都是基于R语言本身来实现的,而向量操作是基于底层的C语言函数实现的,所以使用apply()函数家族进行
转载
2023-06-25 15:27:34
364阅读
文章目录综括==apply函数==利用apply函数实现利用循环实现定义一个结果的数据框定义for循环利用R的特性三种方法消耗时间比较==lapply函数====sapply函数==vapply函数==mapply函数====tapply函数==rapply函数eapply函数 综括apply函数
apply函数是最常用的代替for循环的函数。apply函数可以对矩阵、数据框、数组(二维、多维)
转载
2023-07-06 16:47:22
112阅读
R语言之for循环注:来源为李东风R语言教程 使用for循环的注意事项: 如果对向量每个元素遍历并保存结果, 应在循环之前先将结果变量产生等长的存储, 在循环内为已经分配好存储空间的输出向量的元素赋值。 为了产生长度为n的数值型向量,用numeric(n); 为了产生长度为n的列表,用vector(“list”, n)。 对一个向量元素遍历时如果用下标访问, 需要用seq_along(x)的做法而
转载
2023-05-23 13:40:55
480阅读
前记Blending和stacking是两种类似的模型融合的方法(ensembling),在开始之前我强烈推荐 https://mlwave.com/kaggle-ensembling-guide/mlwave.com
阅读这篇文章,它非常易于理解,非常适合入门; 孔多塞陪审团定理(1784)某种程度是描述模型融合的;该定理主要阐述了,如果每个陪审员都是独立做决断的,当每个陪
转载
2023-09-11 22:09:52
129阅读
R语言 R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R语言特点 R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX、Windows和Macintosh的操作系统上,而且嵌入了一个
转载
2023-07-25 19:51:49
116阅读
中介变量(mediator)是一个重要的统计概念,如果自变量 X 通过某一变量 M 对因变量 Y 产生一定影响,则称 M 为 X 和 Y 的中介变量。我们既往已经介绍了SPSS行中介效应分析和R语言mediation包行中介效应分析,今天继续介绍R语言medflex包中介效应分析。 我们先导入数据和R包library(medflex)
UPBdata<-read.csv("E:/r/test
转载
2023-09-01 21:21:59
87阅读
#初步使用R语言进行作图
#绑定数据框mtcars这样之后作图就可以直接使用mtcars中的数据了
attach(mtcars)
#打开一个图形窗口并生成一副散点图,横轴表示车身重量,纵轴表示每加仑行驶的英里数
plot(wt,mpg)
#向图形中添加一条最优拟合曲线
abline(lm(mpg~wt))
#添加标题
title("Regression of MPG on Weight")
#解除
转载
2023-08-11 17:44:48
167阅读