索引

  • 前言
  • 服务器租用
  • 服务器配置
  • 1.阿里云服务器连接
  • 2.服务器环境配置
  • 总结



前言

开始用服务器跑模型了,所以记录一下自己搭建服务器时遇到的问题。


服务器租用

一开始租用了阿里云的助学服务器1C-1G-3M的服务器,先拿来练练手搭建环境啥的,还是可以的。毕竟拿实验室的把搭好的环境弄坏了,可就摊上事儿了。。。

5台服务器配置ha hadoop 配置一台服务器_服务器

服务器配置

1.阿里云服务器连接

首先,在某宝或者官网租一个服务器就可以了,卖家会将搭建的视频发给你,很好操作,这步没问题。

其次,阿里云服务器只支持Linux(我租的那款),连接工具没有要求,mobaxterm/xshell等,只要有ssh的都可以,这一步具体的操作看自己的软件来。

最后,弄好上述的东东,你就可以远程使用服务器跑代码了。

2.服务器环境配置

租好服务器就以为没事了吗?!

5台服务器配置ha hadoop 配置一台服务器_云服务器_02


此时,你租的是一个没有灵魂的空壳,环境都没配置,要啥啥没有,所以需要配置你需要的环境想安装的软件等。

敲黑板
下面就是鄙人配置环境时踩过的坑。。。。。。

我一开始安装软件的时候,采用的都是pip install ···去安装,也不是说pip不好,主要是我安装在root下了(就相当于是根目录/主环境/权限最高的那嘎达了),最后就导致安装的乱七八糟,想改的时候也很麻烦,而且万一下一个model的环境不一样,我还得重新安装。所以最好的办法就是用Anaconda建立虚拟环境,每个环境都独立,这样你不想用这个环境的时候删掉就好了,和其他环境是独立不影响的!!!

  1. Anaconda的安装和配置:百度一下你就知道~~~遁走。。。。
  2. 在服务器上创建一个虚拟环境
    conda create -n your_env_name python=X.Xanaconda 命令创建python版本为X.X、名字为your_env_name的虚拟环境
  3. 激活环境
    conda activate your_env_name进入虚拟环境后,命令行前面就有一个小括号,里面是你创建的环境名称,这样就代表进入成功了。
  4. 在环境中安装你需要的软件
    conda install xxx 具体的conda指令,在服务器上输入conda他就会弹出来了
    注意也可以使用pip install但是如果你是租用的服务器,下载速度如果很慢呢,可能因为你使用的源是国外的,血与泪的教训,我下一个python下了几个小时,我还一直吐槽家里的网速怎么只有几十kb,草率了!!! 这时候你可以使用pip install xxx -i 国内源国内源。。百度一下你就知道,随便用一个就好了。我自己测下来清华的源网速最快,内含的python包也多,GitHub里的python库也可以下载,换成其他源就报错说没有这个库。

总结

大概就这么多了,别看就两个点,我花了三天才理顺了。后来还出现一个奇怪的现象,用阿里云服务器训练我前几篇文章提到的骨龄的model时,在epoch处就不动了,过一会儿就自动killed了。把输入图片和epoch减少也没用,可能是租用的服务器内存太小,或者其他原因,换一台服务器就可以运作了。

总之呢anaconda是真香,我爱了。

5台服务器配置ha hadoop 配置一台服务器_服务器_03