前言

R对windows使用很友好,对Linux来说充满了敌意。小数据可以在windows下交互操作,效果很好很棒。可是当我们要处理大数据,或者要在集群上搭建pipeline时,不得不面对在Linux上装R及想要的R包这个难题,尤其是对非root用户而言更是艰难重重。

准备依赖库

依次安装:zlib/bzip/liblzma/pcre/curl,注意顺序和版本。目前3.4以上3.6以下R版本相对较为稳定和不过时,我自己安装的是3.5.2。

cd zlib-1.2.11
./configure --prefix =/your/path/zlib  #一般最好新建一个目录,以下同理
make  
make install

cd bzip2-1.0.6
make -f Makefile-libbz2_so
然后修改 Makefile 中的PREFIX=/your/path/bzip2
make && make install

cd xz-5.2.3
./configure -prefix=/your/path/xz
make
make install

tar -zxvf pcre-8.41.tar.gz
cd pcre-8.41
./configure --enable-utf --enable-unicode-properties --enable-jit --disable-cpp --prefix /your/path/pcre
#按官方文档的推荐命令的安装参数
make
make install

tar -zxf curl-7.28.0.tar.gz
cd curl-7.28.0
./configure --prefix=/your/path/curl
make
make install

如果没报错,怎么知道自己安装成功了呢?一般在各个库的目录下会新生成bin/include/lib/share等几个目录。

安装R

源码安装方式同其他软件步骤一样,也是configure —— make —— make install,不过肯定没那么顺利,必然会有各种依赖库找不到。1. congure configure是很重要的一步,检查系统环境,准备编译和链接所需依赖及其种种复杂关系,往往死在第一步。

./configure --prefix=/your/wantto/install/R --enable-R-shlib --with-cairo  --with-jpeglib --with-readline --with-tcltk  --with-blas --with-lapack --enable-R-profiling LDFLAGS="-L/your/path/zlib/lib  -L/your/path/bzip2/lib -L/your/path/xz/lib -L/your/path/pcre/lib -L/your/path/curl/lib" CPPFLAGS="-I/your/path/zlib/include -I/your/path/bzip2/include -I/your/path/xz/include -I/your/path/pcre/include -I/your/path/curl/include"
# R也是最好新建一个要安装的路径再指定。指定各依赖库的库文件和头文件。

2.make configure成功,此时如果直接make,一般也会报错,如下:

/usr/bin/ld: warning: libpcre.so.1, needed by ../../lib/libR.so, not found (try using -rpath or -rpath-link)
/usr/bin/ld: warning: liblzma.so.5, needed by ../../lib/libR.so, not found (try using -rpath or -rpath-link)

即使configure已经指定传入了PCRE和XZ这两个库的路径,还是会说缺少libpcre.so.1和liblzma.so.5这两个库文件。 为什么呢?gcc编译链接动态库时很有可能编译通过,但是执行时找不到动态链接库,那是因为-L选项指定的路径只在编译时有效。

如果是root用户,修改/etc/ld.so.conf文件,将前面安装的库的路径添加到这个文件中。

如果是非root用户(绝大多数的我们),解决方法是通过-Wl(大写的W和小写的L),rpath=,使得execute记住链接库的位置。 此时如果在configure的时候加上-Wl,并不会起作用。configure成功的时候不仅生成Makefile,还会生成Makeconf(即将configure的参数传入),因此我们可以直接修改Makeconf中的参数。

LDFLAGS = -L/your/path/zlib/lib  -L/your/path/bzip2/lib -L/your/path/xz/lib -L/your/path/pcre/lib -L/your/path/curl/lib -Wl,-rpath=/your/path/xz/lib -Wl,-rpath=/your/path/pcre/lib
# configure已经传入-L参数,因此我们只需在后面加上-Wl参数并指定相应库路径。注:原来的-L参数仍要保留。
#-L参数只能让路径在gcc编译时有效,而-Wl参数只能让其在运行时有效。

make成功。

3.make install make成功后,一般这一步没啥问题。

参考:https://xieduo7.github.io/2018-04-02-R%E5%AE%89%E8%A3%85.html

安装R包

Linux下安装R包一般有2种方式:1. R CMD INSTALL 下载源码R CMD INSTALL /.../mypackage.tar.gz 也可指定安装库路径:R CMD INSTALL /.../mypackage.tar.gz --library=/your/lib/path 更多参数--help一下

2. install.packageswhich R查看下路径,是否是刚才自己安装的R。敲R,或全路径进入Rinstall.packages('mypackage'),这种方式针对CRAN包。 一般会让你选择镜像。选择自己最近的,有的镜像所含的R包不是很全,需要换一下。如果没有自己想要的镜像,也可自己指定(在R官网中可查镜像https://cran.r-project.org/mirrors.html)。install.packages("packages","repos" = (CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"),lib="/lib/path")

以上针对的是CRAN中的包,如果是 bioconductor包呢? 先装BiocManager,再安装所需R包即可。

install.packages("BiocManager")  #如已安装,后续安装不再需要
BiocManager::install("clusterProfiler")

不推荐以下安装方法,速度会很慢。

source("http://bioconductor.org/biocLite.R")
biocLite("mypackage")

如果不指定R包安装的路径,R包会安装在/your/R/lib64/R/library中,这也是R自带的基础包的目录。

常见操作

1.包的操作和管理

  • 添加环境变量:
export PATH=/your/R/bin:$PATH
export LD_LIBRARY_PATH=/your/complie_tools/zlib/lib:/your/complie_tools/curl/lib:/your/complie_tools/bzip2/lib:/your/complie_tools/pcre/lib:/your/complie_tools/xz/bin:/your/R/lib64/R/lib:$LD_LIBRARY_PATH  #这些都是一些依赖库
  • 添加R库路径到环境变量:
export R_LIBS=/your/R_packages
export R_LIBS=/others/.../R/lib64/R/library #添加环境变量R的lib路径,可以使用别人安装的包

R中用.libPaths()函数查看lib路径,如果有多个lib,install.packages()默认是安装在第一个目录下。如果一开始就没指定R包安装路径并配置环境变量,则默认安装在/your/R/lib64/R/library中。

2. 其他操作 其实和window控制台一样,只是换成了单命令行:

.libPaths() #查看包的安装目录
library() #查看已经安装的包目录
library(package) #载入mypackage包
getOption("defaultPackages") #查看启动R时自动载入的包。
help(package = 'mypackage') #查看‘mypackage’的帮助

args(function):查看函数的参数
example(function):自动运行该函数帮助文档中的例子,很赞!
demo("package"):展示包中demo
vignette('mypackage'):有的包特别是bioconductor的包有vignette
openVignette('mypackage'):这个函数也可以查看vignette,更好用一些
RSiteSearch("helpinfor"):搜索R网站上的“helpinfor”相关信息
help.start():查看已经安装包的详细HTML文档,这个命令非常爽。

search():查看当前载入的包
sessionInfo():查看R中载入的包
methods():查看某个S3泛型函数中所有的方法或者一个类中所有的方法(S3:S version 3)
showMethods(class = "myClass"):查看S4类的方法
findMethods("myMethods"):查看method的代码
class(myObject):查看某个对象的类
getClass(“class/package”):查看某个class或者包的具体内容
getSlots("class"):查看某个class的slot
slotNames(MyObject):查看某个对象的slot。
可以使用Myobject@slotNames访问对象的slot值,这个@设计实在是太爽了,可以连续用。

查询包内信息:
1. ?function/method:查看某个“函数”或者“方法”的详细内容
2. class?graph::graph:查看“组”的详细内容的一个例子。这个例子的来源是查询graph包时候,查看其中class的信息,输入??graph后出现一个graph::graph-class。

ls("package:mypackage"):查看"mypackage"中的所有对象。

Ref: