RStudio 的1.1.463 是支持32位Windows系统的最后一个版本,在升级到1.2版本之后,除了只能在64位系统运行外,RStudio还增加了一项后台运行任务的功能。一开始我以为,这个功能可以让我将当前的程序丢到后台,然后继续运行下一行,但后来发现并不是我想的那么高级。它只是简化了调用Rscript
运行代码步骤而已。
下面以一个例子来介绍下该功能,当我们在当前工作环境下运行了i <- 1:1000
, 环境变量中就有一个i
。此时我们新建一个脚本"job2.R", 里面只有一行命令
j <- i ^2
接着启动任务(左下角的面板,如果没有说明版本低了)
Fig1
默认情况下, 任务配置如下,也就是会以一个全新的环境运行,运行结束后也不会将变量保存在当前环境中。
Fig2
由于job2.R里的j依赖于已有的i, 因此本次运行会失败。
Error in eval(statements[[idx]], envir = sourceEnv) :
object 'i' not found
Calls: sourceWithProgress -> eval -> eval
Execution halted
重新运行时候勾选"Run job with copy of global environment"就可以正常运行,但是运行结果得到的j, 如果脚本中没有将其保存在磁盘上的代码,那么默认情况下我们是无法在当前环境中使用到该变量的。
"Copy job results" 里有三个选项:
- Don't copy: 不复制到当前全局变量
- To global environment: 变量直接复制到当前全局变量,
- To results object in global environment: 变量会存放在一个列表中,然后复制到当前全局变量
如果运行结束后的变量和当前环境不冲突,我们可以选择"To global environment", 如果存在冲突,比如原来的变量中已经有一个j, 那么选择"To result object in global environment" 是更好的选择。下面就是以第三个选项运行代码后,全局变量中的变量名。
Fig3
最后总结下知识点:
- 这个功能本质是用Rscript在后台运行脚本
- 使用场景,当一个代码运行时间特别久,而后续代码不依赖于该输出结果。
- 当前环境变量并不会自动出现在待运行的任务中
- 待运行的任务不会继承当前环境下加载的R包
- 任务运行后的环境变量默认不会存在当前的环境变量中