RStudio 的1.1.463 是支持32位Windows系统的最后一个版本,在升级到1.2版本之后,除了只能在64位系统运行外,RStudio还增加了一项后台运行任务的功能。一开始我以为,这个功能可以让我将当前的程序丢到后台,然后继续运行下一行,但后来发现并不是我想的那么高级。它只是简化了调用Rscript运行代码步骤而已。

下面以一个例子来介绍下该功能,当我们在当前工作环境下运行了i <- 1:1000, 环境变量中就有一个i。此时我们新建一个脚本"job2.R", 里面只有一行命令

j <- i ^2

接着启动任务(左下角的面板,如果没有说明版本低了)





rstudio使用GPU rstudio怎么运行程序_数据库


Fig1


默认情况下, 任务配置如下,也就是会以一个全新的环境运行,运行结束后也不会将变量保存在当前环境中。


rstudio使用GPU rstudio怎么运行程序_java_02


Fig2


由于job2.R里的j依赖于已有的i, 因此本次运行会失败。

Error in eval(statements[[idx]], envir = sourceEnv) :
  object 'i' not found
Calls: sourceWithProgress -> eval -> eval
Execution halted

重新运行时候勾选"Run job with copy of global environment"就可以正常运行,但是运行结果得到的j, 如果脚本中没有将其保存在磁盘上的代码,那么默认情况下我们是无法在当前环境中使用到该变量的。

"Copy job results" 里有三个选项:

  1. Don't copy: 不复制到当前全局变量
  2. To global environment: 变量直接复制到当前全局变量,
  3. To results object in global environment: 变量会存放在一个列表中,然后复制到当前全局变量

如果运行结束后的变量和当前环境不冲突,我们可以选择"To global environment", 如果存在冲突,比如原来的变量中已经有一个j, 那么选择"To result object in global environment" 是更好的选择。下面就是以第三个选项运行代码后,全局变量中的变量名。


rstudio使用GPU rstudio怎么运行程序_linux_03


Fig3


最后总结下知识点:

  • 这个功能本质是用Rscript在后台运行脚本
  • 使用场景,当一个代码运行时间特别久,而后续代码不依赖于该输出结果。
  • 当前环境变量并不会自动出现在待运行的任务中
  • 待运行的任务不会继承当前环境下加载的R包
  • 任务运行后的环境变量默认不会存在当前的环境变量中