目录
1. 安装Anaconda
2. 配置Conda虚拟环境
3. 安装CUDA10.0xxx
4. 测试Nvida CUDA
5. 安装cuDNN
6. Pycharm测试程序
7. YOLO v4 Keras(tensorflow)训练结果
1. 安装Anaconda
网页搜索Anaconda,下载win10 64位版本按照流程安装即可。
注意: 需要将环境conda路径添加至系统的环境变量中去,复选框选中即可。
2. 配置Conda虚拟环境
打开anaconda软件,在环境environment一栏中创建新的虚拟环境。
再安装相应的依赖库,如tensorflow-gpu、keras-gpu、pytorch等,版本对应如下:(建议安装tensorflow-gpu13.1及其对应的库版本)
3. 安装CUDA10.0xxx
CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员现在可以使用C语言来为CUDA™架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA™的处理器上以超高性能运行。CUDA3.0已经开始支持C++和FORTRAN。
计算行业正在从只使用CPU的“中央处理”向CPU与GPU并用的“协同处理”发展。为打造这一全新的计算典范,NVIDIA™(英伟达™)发明了CUDA(Compute Unified Device Architecture,统一计算设备架构)这一编程模型,是想在应用程序中充分利用CPU和GPU各自的优点。现在,该架构已应用于GeForce™(精视™)、ION™(翼扬™)、Quadro以及Tesla GPU(图形处理器)上。
旧版本CUDA下载地址:https://developer.nvidia.com/cuda-toolkit-archive
版本对应:(建议CUDA10.0xxx,以及cuDNN7.4xxx和tensorflow-gpu13.0或14.0)
部分显卡算力排行:
安装过程:
注意事项:
临时解压路径,建议默认即可,也可以自定义。安装结束后,临时解压文件夹会自动删除;
安装目录,建议默认即可;
临时解压目录千万不要和cuda的安装路径设置成一样的,否则安装结束,会找不到安装目录的!!!
选择自定义安装
安装完成后,配置cuda的环境变量;
命令行中,测试是否安装成功;
重要过程如下:
1. 临时解压
2. 选择自定义安装
按照需要勾选,然后安装路径全部默认不做修改。安装完成之后会自动将CUDA的路径添加到系统的环境变量中去。
从系统的环境变量中可以看到CUDA已经自动添加进来。
4. 测试Nvida CUDA
WIN+R: cmd
nvcc -- version 查看CUDA版本
nvidia-smi 查看显卡信息
至此,CUDA安装成功
5. 安装cuDNN
下载链接:https://developer.nvidia.com/rdp/cudnn-archive#a-collapse7415-10
选择自己需要的且对应的版本即可。
安装过程:
将下载来的压缩包解压文件夹,将解压后的文件夹下的文件拷贝到cuda安装目录下,与之相对应的文件夹下。
复制到这个目录下并替换:
OK,完成!!!
6. Pycharm测试程序
首先安装相关的依赖库:
pip install tensorflow-gpu==1.12.2 -i https://pypi.tuna.tsinghua.edu.cn/simple pip install keras==2.2.5 -i https://pypi.tuna.tsinghua.edu.cn/simple pip install pydot -i https://pypi.tuna.tsinghua.edu.cn/simple pip install cython -i https://pypi.tuna.tsinghua.edu.cn/simple pip install pycocotools -i https://pypi.tuna.tsinghua.edu.cn/simple
......
...
.
训练过程引用作者原文:
下载我从Tianxiaomo的仓库保存下来的pytorch模型yolov4.pt 链接:https://pan.baidu.com/s/152poRrQW9Na_C8rkhNEh3g 提取码:09ou
将它放在项目根目录下。然后运行1_pytorch2keras.py得到一个yolov4.h5,它也位于根目录下。 运行train.py进行训练。通过修改config.py代码来进行更换数据集、更改超参数以及训练参数。
追求更高的精度,你需要把冻结层的代码删除,也就是train.py中ly.trainable = False那一部分。但是需要你有一块高显存的显卡。 训练时默认每5000步计算一次验证集的mAP。
训练时如果发现mAP很稳定了,就停掉,修改学习率为原来的十分之一,接着继续训练,mAP还会再上升。暂时是这样手动操作。
按照说明下载好数据集coco2017并分类之后开始训练:
数据集:
由yolov4.pt模型转换到keras模型:运行1_pytorch2keras.py得到一个yolov4.h5
修改config.py和train.py文件中的硬件参数和训练参数,运行开始训练:
漫长的等待时间,,,,等它跑完了再来更新。
7. YOLO v4 Keras(tensorflow)训练结果