目录

1. 安装Anaconda

2. 配置Conda虚拟环境

3. 安装CUDA10.0xxx

4. 测试Nvida CUDA

5. 安装cuDNN

6. Pycharm测试程序

7. YOLO v4 Keras(tensorflow)训练结果


1. 安装Anaconda

网页搜索Anaconda,下载win10 64位版本按照流程安装即可。

注意: 需要将环境conda路径添加至系统的环境变量中去,复选框选中即可。

yolox部署Android闪退_YOLO V4


2. 配置Conda虚拟环境

打开anaconda软件,在环境environment一栏中创建新的虚拟环境。

yolox部署Android闪退_cuDNN_02

再安装相应的依赖库,如tensorflow-gpu、keras-gpu、pytorch等,版本对应如下:(建议安装tensorflow-gpu13.1及其对应的库版本

yolox部署Android闪退_CUDA_03


3. 安装CUDA10.0xxx

CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员现在可以使用C语言来为CUDA™架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA™的处理器上以超高性能运行。CUDA3.0已经开始支持C++和FORTRAN。 
计算行业正在从只使用CPU的“中央处理”向CPU与GPU并用的“协同处理”发展。为打造这一全新的计算典范,NVIDIA™(英伟达™)发明了CUDA(Compute Unified Device Architecture,统一计算设备架构)这一编程模型,是想在应用程序中充分利用CPU和GPU各自的优点。现在,该架构已应用于GeForce™(精视™)、ION™(翼扬™)、Quadro以及Tesla GPU(图形处理器)上。 

旧版本CUDA下载地址https://developer.nvidia.com/cuda-toolkit-archive

版本对应:(建议CUDA10.0xxx,以及cuDNN7.4xxx和tensorflow-gpu13.0或14.0)

yolox部署Android闪退_yolox部署Android闪退_04

部分显卡算力排行:

yolox部署Android闪退_cuDNN_05

安装过程:

注意事项:

 临时解压路径,建议默认即可,也可以自定义。安装结束后,临时解压文件夹会自动删除;

安装目录,建议默认即可;

临时解压目录千万不要和cuda的安装路径设置成一样的,否则安装结束,会找不到安装目录的!!!

选择自定义安装

安装完成后,配置cuda的环境变量;

命令行中,测试是否安装成功;

重要过程如下:

1. 临时解压

yolox部署Android闪退_机器学习_06

2. 选择自定义安装

yolox部署Android闪退_YOLO V4_07

yolox部署Android闪退_CUDA_08

yolox部署Android闪退_CUDA_09

按照需要勾选,然后安装路径全部默认不做修改。安装完成之后会自动将CUDA的路径添加到系统的环境变量中去。

yolox部署Android闪退_YOLO V4_10

yolox部署Android闪退_CUDA_11

从系统的环境变量中可以看到CUDA已经自动添加进来。


4. 测试Nvida CUDA

WIN+R: cmd

yolox部署Android闪退_yolox部署Android闪退_12

nvcc -- version 查看CUDA版本

yolox部署Android闪退_机器学习_13

nvidia-smi 查看显卡信息

yolox部署Android闪退_机器学习_14

至此,CUDA安装成功


5. 安装cuDNN

下载链接:https://developer.nvidia.com/rdp/cudnn-archive#a-collapse7415-10

yolox部署Android闪退_CUDA_15

选择自己需要的且对应的版本即可。

安装过程:

将下载来的压缩包解压文件夹,将解压后的文件夹下的文件拷贝到cuda安装目录下,与之相对应的文件夹下。

yolox部署Android闪退_cuDNN_16

复制到这个目录下并替换:

yolox部署Android闪退_YOLO V4_17

OK,完成!!!

6. Pycharm测试程序

首先安装相关的依赖库:


pip install tensorflow-gpu==1.12.2 -i https://pypi.tuna.tsinghua.edu.cn/simple pip install keras==2.2.5 -i https://pypi.tuna.tsinghua.edu.cn/simple pip install pydot -i https://pypi.tuna.tsinghua.edu.cn/simple pip install cython -i https://pypi.tuna.tsinghua.edu.cn/simple pip install pycocotools -i https://pypi.tuna.tsinghua.edu.cn/simple


......

...

.

训练过程引用作者原文:

下载我从Tianxiaomo的仓库保存下来的pytorch模型yolov4.pt 链接:https://pan.baidu.com/s/152poRrQW9Na_C8rkhNEh3g 提取码:09ou

将它放在项目根目录下。然后运行1_pytorch2keras.py得到一个yolov4.h5,它也位于根目录下。 运行train.py进行训练。通过修改config.py代码来进行更换数据集、更改超参数以及训练参数。

追求更高的精度,你需要把冻结层的代码删除,也就是train.py中ly.trainable = False那一部分。但是需要你有一块高显存的显卡。 训练时默认每5000步计算一次验证集的mAP。

训练时如果发现mAP很稳定了,就停掉,修改学习率为原来的十分之一,接着继续训练,mAP还会再上升。暂时是这样手动操作。

按照说明下载好数据集coco2017并分类之后开始训练:

数据集:  

yolox部署Android闪退_cuDNN_18

 

由yolov4.pt模型转换到keras模型:运行1_pytorch2keras.py得到一个yolov4.h5

yolox部署Android闪退_yolox部署Android闪退_19

修改config.py和train.py文件中的硬件参数和训练参数,运行开始训练:

yolox部署Android闪退_YOLO V4_20

漫长的等待时间,,,,等它跑完了再来更新。


7. YOLO v4 Keras(tensorflow)训练结果