CUDA是NVIDIA公司开发的并行运算平台,主要用于需要GPU加速的应用,目前很多做深度学习研究的人员使用caffe和cuda平台做模型训练和相关应用。而cuda的安装有时候是很容易出问题的,比如当有集成显卡和独立显卡并存的情况。而cuda的安装方式也有几情况,可以参考cuda的安装手册【安装手册】。
Ubuntu14.04目前来说是一个相对兼容性很好的平台,CUDA截至到目前已经发布到9.0了版本,而9.0支持ubuntu16.04和ubuntu17.04,不再支持低于ubuntu16.04版本的ubuntu系统。CUDA8.0支持ubuntu16.04和ubuntu14.04,相比与CUDA7.5,CUDA8.0支持GPU compute_60等架构,对于目前的中高端nvidia显卡,支持性比较好。CUDA的安装成功与否与显卡驱动以及安装的机子都有关系,本人也是遇到了不小的麻烦,前后倒腾了好几天,如果你想安装CUDA的某版本,首先请检查你的显卡是否支持CUDA相应版本【点击查看8.0适用的显卡类型】,其次CUDA安装的时候可以自动安装显卡驱动,安装的显卡驱动的类型可以查看runfile安装包的名字(比如这里的安装包为cuda_8.0.61_375.26_linux.run,说明本CUDA8.0安装的时候对应安装的显卡驱动是375.26版本),你可以去看一下你的这个显卡驱动是否完美支持你显卡,一般都是可以的,375.26可以支持GTX 1050(ti),1060, 1070, 1080,980,970等显卡。
本人的硬件平台:
1:Ubuntu14.04(是一个相对兼容性很好的平台)
2:cuda 8【下载】
3:NVIDIA GTX 1050ti
cuda的安装方式有二进制runfile安装方式和deb安装方式,相对来说runfile安装更不容易出问题。选择runfile包并下载到Ubuntu中,以做备用。如下图所示。
cuda安装手册是一个非常全的手册,描述了cuda安装需要的各种硬件、依赖和详细的安装过程。这里以runfile安装进行介绍:
1:打开终端,运行
sudo apt-get install build-essential
2:禁用mouveau,在/etc/modprobe.d/下创建文件blacklist-nouveau.conf
cd /etc/modprobe.d/
sudo touch blacklist-nouveau.conf
sudo vim blacklist-nouveau.conf
然后在打开的文本里输入以下内容:
blacklist nouveau
options nouveau modeset=0
保存并使设置生效
sudo update-initramfs -u
输入以下指令检查是否成功被禁用
lsmod | grep nouveau
如果没有内容输出,则证明已经成功禁用
3:重启电脑,到达登录界面时,按住ctl+alt+f1,进入text mode ,键入用户名和密码进入.
5:关闭图形化界面
sudo service lightdm stop
6:切换到cuda安装目录,进行安装
sudo sh cuda_8.0.61_375.26_linux.run
7:根据安装提示,一步一步来
(当遇到时候询问是否安装openGL的时候,要小心,如果你只是想用nvidia进行计算,用比如intel集成显卡显示的话,就不需要安装,他会覆盖掉你原有的openGL,造成后续一些错误,一般这个可不选)
Accept EULA conditions
Say YES to installing the NVIDIA driver
SAY YES to installing CUDA Toolkit + Driver
Say YES to installing CUDA Samples
安装完成。
8:重新打开图形化界面
sudo service lightdm start
按住ctl+alt+f7,返回到图形化登录界面(我的是直接跳到了图形化登录界面),如果不能登录,而是循环登录则有问题。
9:重启电脑检查Device Node Verification,检查路径/dev下 有无存在名为nvidia*(以nvidia开头)的多个文件(device files) 如果没有的话,可以参考官方文档里的指导步骤,进行添加。如果没有的话可以使用sudo modprobe nvidia进行添加,还不行的话,nvidia的使用手册上有另外一种方法,添加启动脚本的方法
可以参考这个帖子【添加脚本】
10:设置环境变量
终端中输入
$ sudo gedit /etc/profile
在打开的文件末尾,添加以下两行,保存文件并退出。
$ export PATH=/usr/local/cuda-8.0/bin:$PATH
$ export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH
这里有点与官方安装文档稍有不同,需要说明:
官方文档里说只需在终端中运行上述两条export语句即可,但如果不将它们不写入/etc/profile文件的话,这样的环境变量在你退出终端后就消失了,不起作用了,所以写入才是永久的做法。
11:重启电脑,检查上述的环境变量是否设置成功。
终端中输入 :
$ env
在输出的环境变量中检查有无上述 10) 中设置的变量,如果有则代表设置成功。到此为止,CUDA的安装算是告一段落了。为了保险起见,建议进行下述的检查工作,确保真正的安装成功。
12: 安装完毕后的检查工作。
a):检查 NVIDIA Driver是否安装成功
$ cat /proc/driver/nvidia/version #会输出NVIDIA Driver的版本号
b):检查 CUDA Toolkit是否安装成功
$ nvcc –V #会输出CUDA的版本信息
c):尝试编译cuda提供的例子,切换到例子存放的路径,默认路径是 ~/NVIDIA_CUDA-8.0_Samples (即 /home/xxx/ NVIDIA_CUDA-8.0_Samples, xxx是你自己的用户名)
$ make
d):如果出现错误的话,则会立即报错停止,否则会开始进入编译阶段。整个编译的时间持续比较长,耐心等待,大概十几分钟是需要的。由于你可能是自己手动通过apt-get的方法安装的显卡驱动,你有可能会遇到这个问题:
/usr/bin/ld: cannot find -lnvcuvid
可以参照这个帖子
#modify /home/dorioliu/NVIDIA_CUDA-8.0_Samples/common/findgllib.mk中
UBUNTU_PKG_NAME = "nvidia-375"
#to
UBUNTU_PKG_NAME = "nvidia-xxx" #修改为你实际安装的版本
然后再次编译就成功了。
f):运行编译生成的二进制文件。
编译后的二进制文件 默认存放在~/NVIDIA_CUDA-8.0_Samples/bin中。
切换路径 :
cd ~/NVIDIA_CUDA-8.0_Samples/bin/x86_64/linux/release
终端输入:
$ ./deviceQuery
还有
$ ./bandwidthTest
如果这两个都pass了
(看到类似如下图片中的显示)则代表CUDA安装且配置成功(congratulation!!),最后感谢我引用的那几个帖子的帖主。