数据分析科学(统计学、计量心理学、计量经济学、机器学习)的发展一直与数据的爆炸式增长保持同步。
典型的数据分析步骤:
1.1 为什么要使用R
- R可以轻松的从各种类型的数据源导入数据,包括文本文件、数据库管理系统、统计软件、乃至专门的数据仓库
- R是免费的
- R是一个全面的统计研究平台
- R的可视化牛……
1.2 R的获取和安装
1.3 R的使用
R是一种区分大小写的解释型语言。
一次交互会话期间的所有数据对象都被保存在内存中,一些基本函数是默认直接可用的,而其他高级函数则包含于按需加载的程序包中。
R语句由函数和赋值构成。R使用 <- 来进行赋值。
注释由符号#开头
1.3.1 几个简单函数
c():以向量的形式输入数据
mean(),sd(),cor():分别获得均值、标准差和相关度
plot():用图形展示变量之间的关系
q():退出R
1.3.2 R中的帮助文档
R中的帮助函数:
R提供了大量的帮助功能,学会如何使用这些帮助文档,毫无疑问有助于编程。可是使用?来查看某些函数的功能。
1.3.3 工作空间
- 工作空间(workspace)就是当前R的工作环境,它存储着所有用户定义的对象(向量、矩阵、函数、数据框、列表)。在一个R会话结束时,可以将当前工作空间保存到一个镜像中,并在下次启动R时自动载入它。
- 使用上下方向键可以查看已输入命令的历史记录
- 可以使用函数
getwd()
来查看当前的工作目录;或者使用setwd()
来设定当前的工作目录。如果需要读入一个不再当前工作目录下的文件,则需要在调用语句中写明完整的路径。记得使用引号闭合这些目录名和文件名;也可以使用dir.create( )
来创建新目录
用于管理R工作空间的函数如下:
1.4 包
R提供了大量开箱即用的功能,它最激动人心的一部分功能是通过可选模块得下载和安装来实现的。search()
可以告诉你那些包已加载并可使用
- 包的安装:install.packages( )
- 包的载入:library( )
1.5 R语言编程中的常见错误
最近在写毕业论文,需要用到R语言做实验,简提单的学习一下R语言,做一些笔记。最近生活有些懈怠,对自己的要求也放松了很多,这样做不好。今天早上来实验室,在楼下看到了学部的90多岁的院士,提着一个小包,我快跑了几步,帮他开了一下门,他很有礼貌的冲我笑了一下,让人感动的是,他进门后,还用手支着门方便我进来。所以,人,不管是任何身份,不管是在任何时候,都不可以放松对自己的要求。严格要求自己总是好的,懈怠的人生没有乐趣,所以,继续加油!