遇到这个问题,应该就是自己电脑上要跑个深度学习的代码,需要个大点的GPU(16Gor32G),甚至不止一个,最近做毕业设计,16G显卡没够用,想着在家整个服务器试试。
1,租个服务器,初学者和非初学者都可以用阿里云,因为细节好、便宜、稳定、高级。
我们直接进入购买页面,你可以自己慢慢了解,但对于穷人家孩子,抢占式实例要比按量付费便宜(遑论包年包月)。我的选择大概如下:
相关的具体内容设置,可以自己看后面的圈?(如下),镜像的设置我使用了CentOS,感觉算是比较好用,不会有奇怪的错误。
二、登陆。刚刚的一系列操作应该已经让我们完成购买了GPU服务器,GPU的数量和大小是你自己选的,一般一个GPU也够用。然后就该登陆了,我没有截图,不过解释起来也不会太复杂。我们在网页就可以通过点击登陆实例来进入终端,不过如果需要传输文件的话,还是需要下载些软件的,我用的是Mac,有一款免费的软件很好用Royal TSX,mac专用的SFTP传输和终端连接等工具,windows就有很多了,网上一查便知(mobaxterm、Xmanager算是好用的)。可以用这些软件连接服务器,传输文件。记得在购买服务器的时候,你设置了登陆密码,用户名可能是root之类的(也可以选择密钥,但我习惯了用密码登陆),IP地址就是公网地址,有了这些你就能连接上服务器了。如果这里有些内容不清楚,可百度。我的建议是,SFTP用Royal TSX,在终端里的操作以网页的形式打开就好,操作起来也是很方便的。
三、配置pytorch环境
这个步骤我觉得下面几个链接是值得推荐的。
简单的总结一下我的步骤:
1,登陆终端,在Royal里设置好,SFTP连接,准备传输文件。
2,在Anaconda官网上下载.sh文件,并上传到服务器目录里。
3,上传完成后,终端里命令行运行
bash XXX.sh
#其中xxx是你下载的安装包名字
4,安装后,重启终端。
5,新建一个python虚拟环境。
conda create -n torch python=3.7
6,激活环境后,按照上述链接中的添加新镜像源,两个链接中镜像源不大一样,要把提到的都加入进去,才会没问题。之后按照其步骤操作即可。很easy
7,检查环境,conda list看看是不是想要的版本,以及pytorch是不是GPU版本的。finished!