R语言数据分析

  • R语言与数据分析概述
  • 基本操作命令
  • 基本数据类型
  • 数据类型的转换
  • 运算符
  • R中的数据结构
  • 代码展示


R语言与数据分析概述

R语言是一种开源的脚本语言,诞生于1993年,R系统是开源、免费的。
数据分析过程:
数据导入——数据清洗——数据探索——数据建模——可视化——报告发现

基本操作命令

注:*处写包名

函数

说明

getwed()

显示当前工作目录

setwd ()

修改当前工作目录

ls ()

显示当前工作空间中的所有对象

str ()

显示对象的结构

ls.str ()

显示对象中每一个变量的结构

exists ()

当前工作空间内是否存在某个对象

rm ()

删除一个多或多个对象

q ()

退出R。在这之前会询问是否保存工作空间

.libPaths ()

查看该文件夹在计算机中的具体路径

install.packages ()

安装包

library ()

显示已安装的包的列表

search()

显示已加载的包的列表

library("*")

加载这个包

detach(“packages:*”)

移除包

remove.packages(“*”)

卸载包

基本数据类型

类型

说明

判断函数

R语言形式

逻辑型

表示逻辑值的二值数据,只有TRUE或 FALSE两个取值。在R中,逻辑表达式 的赋值会得到逻辑型数据,例如比较 两个数的大小2>1等于TRUE

is.logocal()

TRUE , 2 <= 1

浮点型

用十进制表示的实数,如1,1.1等, 是用于计算的基本数据形式

is.double ()

3.14

整数型

用于描述整数,如1,2,3。需要注意 的是,在R语言中,在整数后加上字符 L才代表整型数,否则会被视为浮点

is.integer()

3L

字符型

用于表示一个字符串

is.character ()

“Hello”,“3.14”

复数型

用于表示复数值,其中虚部用i表示, 例如2+3i

is.complex ()

1+i

原始型

用于保存原始的字节,其中每个字节 用两个十六进制数表示,例如A3

is.raw ()

00

数据类型的转换

逻辑型 ——整数型 ——浮点型 ——字符型

运算符

R语言shiny 数据分析 r语言数据分析方法_r语言

R中的数据结构

➢向量 ➢矩阵 ➢数组 ➢列表 ➢数据框 ➢因子
向量功能:
✓创建向量
✓访问元素
✓添加元素
✓删除元素
✓获取向量长度

代码展示

#基本数据类型
getwd()

install.packages("stringr")
.libPaths()
library()
search()
library("stringr")
str_length ("Hello R!")

detach("package:stringr")
str_length ("Hello R!")

remove.packages("stringr")
library("stringr")


#基本数据类型
num <- 100;num
is.integer(num)#?
is.double(num)#?
typeof(num)
num2 <- 100L
typeof(num2)


is.logical(TRUE)
is.logical(T)
is.logical(5)#?
is.logical(0)#?
is.character("R program")



#数据类型转换
logi_vec <- T
typeof(logi_vec)
int_vec <- c(100L,200L)
typeof(int_vec)
double_vec <- c(10,20)
typeof(double_vec)
chr_vec <-c("伟大的","中国人民")
typeof(chr_vec)
typeof(c(logi_vec,int_vec))#?验证逻辑型和整数型
typeof(c(int_vec,double_vec))#?验证逻辑型和整数型
typeof(c(double_vec,chr_vec))#?验证逻辑型和整数型
typeof(c(logi_vec,int_vec,double_vec,chr_vec))#?验证逻辑型和整数型

1 == '1' 



#在运算过程中,数据类型自动转换
2*T  #?
10+FALSE #?
10+TRUE
exp(F) #?
10 & 0 #?
10 | 0 #?


#使用as***函数强制转换数据类型
as.numeric(F)
as.numeric("1000.01")
as.numeric("你好")
as.logical(0)
as.logical(10)
as.logical(-10)
as.logical("T")
as.logical("F")
as.character(c(T,F,TRUE,FALSE))
as.character(10.99)



#特殊值
#NA
a <- 100
a[1]
a[2]
num_vec <- c(1,2)
length(num_vec) <- 4
num_vec
#Inf 无穷大
10/0
-10/0

0/0
Inf-Inf

num_vec1 <- c(1,5,NaN)
length(num_vec1)
num_vec2 <- c(1,5,NULL)
length(num_vec2)


#运算符
#逻辑运算 & vs &&
logi_vec1 <- c(T,F,T)
logi_vec2 <- c(F,T,T)
logi_vec1 & logi_vec2
logi_vec1 && logi_vec2

logi_vec1 <- c(T,F,T) #向量长度不同,短的循环补齐
logi_vec2 <- c(T,T,T,F)
logi_vec1 & logi_vec2
logi_vec1 && logi_vec2


logi_vec1 <- c(T,F,T)

#逻辑运算| vs ||
logi_vec1 <- c(T,F,T)
logi_vec2 <- c(F,T,T)
logi_vec1 | logi_vec2
logi_vec1  || logi_vec2


a <-T
b <- 10L
c <- 20
d <-"R";
typeof(c(a,b,c,d))



#向量
vec <- c(1,5,6,8,9)

#访问元素
vec[1]
vec[0]
vec[2:3]
vec[2:5]
vec[c(1,3)]#访问不连续的怎么办
vec[c(1,3,2)] #想重复访问
#添加元素
vec
vec <- c(vec[1:2],10,vec[3])
vec
#删除元素
vec
vec <-vec[-3]
vec
#获取向量长度
vec <- letters
vec
length(vec)
vec[-length(vec)] #删除x,y,z怎么做?
vec[-length(vec):-length(vec)+2]
-length(vec):-length(vec)+2#注意加括号
-length(vec):(-length(vec)+2)
vec[-length(vec) : (-length(vec)+2)]

#创建向量
#Q:创建向量的方法
1:5
1:-5
c(1L,2.0,"a")
67#1,3,5,7,9,创建等差数列
?seq
example(seq)
seq(1,9,by =2)

#将某向量重复多次,创建向量
vec <-1:3
#1 2 3 1 2 3 1 2 3 
?rep
example(rep)
rep(vec,3)
#111222333
rep(vec,each = 3)
#创建长度为0的向量
new.vec <- c()
length(new.vec)
new.vec
#判断某班级的学生的年龄是不是都是18岁以上?
stu <- sample(c(17,18,19),10,replace = T)
stu
all(stu >= 18)
stu <- sample(c(18,19),10,replace = T)
stu
any(stu<18)

#any all 你想想可以应用到什么场景中?

#向量运算,算术运算,关运算,逻辑运算
vec1 <- c(1,2)
vec2<- c(10,20)
vec1 * vec2
vec1 == vec2
vec | vec2

#向量运算–循环补齐
vec1 <- c (1,2)
vec2<-c (10,20,30)
vec1 + vec2
vec2<- c(10,20,30,40)
vec1 + vec2

R语言shiny 数据分析 r语言数据分析方法_r语言_02


哆啦A梦欢迎您的到来!