R语言数据分析
- R语言与数据分析概述
- 基本操作命令
- 基本数据类型
- 数据类型的转换
- 运算符
- R中的数据结构
- 代码展示
R语言与数据分析概述
R语言是一种开源的脚本语言,诞生于1993年,R系统是开源、免费的。
数据分析过程:
数据导入——数据清洗——数据探索——数据建模——可视化——报告发现
基本操作命令
注:*处写包名
函数 | 说明 |
getwed() | 显示当前工作目录 |
setwd () | 修改当前工作目录 |
ls () | 显示当前工作空间中的所有对象 |
str () | 显示对象的结构 |
ls.str () | 显示对象中每一个变量的结构 |
exists () | 当前工作空间内是否存在某个对象 |
rm () | 删除一个多或多个对象 |
q () | 退出R。在这之前会询问是否保存工作空间 |
.libPaths () | 查看该文件夹在计算机中的具体路径 |
install.packages () | 安装包 |
library () | 显示已安装的包的列表 |
search() | 显示已加载的包的列表 |
library("*") | 加载这个包 |
detach(“packages:*”) | 移除包 |
remove.packages(“*”) | 卸载包 |
基本数据类型
类型 | 说明 | 判断函数 | R语言形式 |
逻辑型 | 表示逻辑值的二值数据,只有TRUE或 FALSE两个取值。在R中,逻辑表达式 的赋值会得到逻辑型数据,例如比较 两个数的大小2>1等于TRUE | is.logocal() | TRUE , 2 <= 1 |
浮点型 | 用十进制表示的实数,如1,1.1等, 是用于计算的基本数据形式 | is.double () | 3.14 |
整数型 | 用于描述整数,如1,2,3。需要注意 的是,在R语言中,在整数后加上字符 L才代表整型数,否则会被视为浮点 | is.integer() | 3L |
字符型 | 用于表示一个字符串 | is.character () | “Hello”,“3.14” |
复数型 | 用于表示复数值,其中虚部用i表示, 例如2+3i | is.complex () | 1+i |
原始型 | 用于保存原始的字节,其中每个字节 用两个十六进制数表示,例如A3 | is.raw () | 00 |
数据类型的转换
逻辑型 ——整数型 ——浮点型 ——字符型
运算符
R中的数据结构
➢向量 ➢矩阵 ➢数组 ➢列表 ➢数据框 ➢因子
向量功能:
✓创建向量
✓访问元素
✓添加元素
✓删除元素
✓获取向量长度
代码展示
#基本数据类型
getwd()
install.packages("stringr")
.libPaths()
library()
search()
library("stringr")
str_length ("Hello R!")
detach("package:stringr")
str_length ("Hello R!")
remove.packages("stringr")
library("stringr")
#基本数据类型
num <- 100;num
is.integer(num)#?
is.double(num)#?
typeof(num)
num2 <- 100L
typeof(num2)
is.logical(TRUE)
is.logical(T)
is.logical(5)#?
is.logical(0)#?
is.character("R program")
#数据类型转换
logi_vec <- T
typeof(logi_vec)
int_vec <- c(100L,200L)
typeof(int_vec)
double_vec <- c(10,20)
typeof(double_vec)
chr_vec <-c("伟大的","中国人民")
typeof(chr_vec)
typeof(c(logi_vec,int_vec))#?验证逻辑型和整数型
typeof(c(int_vec,double_vec))#?验证逻辑型和整数型
typeof(c(double_vec,chr_vec))#?验证逻辑型和整数型
typeof(c(logi_vec,int_vec,double_vec,chr_vec))#?验证逻辑型和整数型
1 == '1'
#在运算过程中,数据类型自动转换
2*T #?
10+FALSE #?
10+TRUE
exp(F) #?
10 & 0 #?
10 | 0 #?
#使用as***函数强制转换数据类型
as.numeric(F)
as.numeric("1000.01")
as.numeric("你好")
as.logical(0)
as.logical(10)
as.logical(-10)
as.logical("T")
as.logical("F")
as.character(c(T,F,TRUE,FALSE))
as.character(10.99)
#特殊值
#NA
a <- 100
a[1]
a[2]
num_vec <- c(1,2)
length(num_vec) <- 4
num_vec
#Inf 无穷大
10/0
-10/0
0/0
Inf-Inf
num_vec1 <- c(1,5,NaN)
length(num_vec1)
num_vec2 <- c(1,5,NULL)
length(num_vec2)
#运算符
#逻辑运算 & vs &&
logi_vec1 <- c(T,F,T)
logi_vec2 <- c(F,T,T)
logi_vec1 & logi_vec2
logi_vec1 && logi_vec2
logi_vec1 <- c(T,F,T) #向量长度不同,短的循环补齐
logi_vec2 <- c(T,T,T,F)
logi_vec1 & logi_vec2
logi_vec1 && logi_vec2
logi_vec1 <- c(T,F,T)
#逻辑运算| vs ||
logi_vec1 <- c(T,F,T)
logi_vec2 <- c(F,T,T)
logi_vec1 | logi_vec2
logi_vec1 || logi_vec2
a <-T
b <- 10L
c <- 20
d <-"R";
typeof(c(a,b,c,d))
#向量
vec <- c(1,5,6,8,9)
#访问元素
vec[1]
vec[0]
vec[2:3]
vec[2:5]
vec[c(1,3)]#访问不连续的怎么办
vec[c(1,3,2)] #想重复访问
#添加元素
vec
vec <- c(vec[1:2],10,vec[3])
vec
#删除元素
vec
vec <-vec[-3]
vec
#获取向量长度
vec <- letters
vec
length(vec)
vec[-length(vec)] #删除x,y,z怎么做?
vec[-length(vec):-length(vec)+2]
-length(vec):-length(vec)+2#注意加括号
-length(vec):(-length(vec)+2)
vec[-length(vec) : (-length(vec)+2)]
#创建向量
#Q:创建向量的方法
1:5
1:-5
c(1L,2.0,"a")
67#1,3,5,7,9,创建等差数列
?seq
example(seq)
seq(1,9,by =2)
#将某向量重复多次,创建向量
vec <-1:3
#1 2 3 1 2 3 1 2 3
?rep
example(rep)
rep(vec,3)
#111222333
rep(vec,each = 3)
#创建长度为0的向量
new.vec <- c()
length(new.vec)
new.vec
#判断某班级的学生的年龄是不是都是18岁以上?
stu <- sample(c(17,18,19),10,replace = T)
stu
all(stu >= 18)
stu <- sample(c(18,19),10,replace = T)
stu
any(stu<18)
#any all 你想想可以应用到什么场景中?
#向量运算,算术运算,关运算,逻辑运算
vec1 <- c(1,2)
vec2<- c(10,20)
vec1 * vec2
vec1 == vec2
vec | vec2
#向量运算–循环补齐
vec1 <- c (1,2)
vec2<-c (10,20,30)
vec1 + vec2
vec2<- c(10,20,30,40)
vec1 + vec2
哆啦A梦欢迎您的到来!