深度学习Halcon中GPU显存利用率高,但GPU、CPU利用率较低,导致模型训练速度很慢,通过设置硬件参数的解决方法

前言

在训练自己模型的时候,会遇到GPU显存利用率高,但GPU、CPU利用率较低,导致模型训练速度很慢的问题。这个问题一方面是由于硬件没有设置到最佳工作状态,另一方面是代码中参数没有设置好。最近在跑Halcon DL遇到这个问题,而Halcon不像开源的几个框架那样自由,代码封装的比较严实。所以遇到这种问题,只能在参数最优的情况下,通过设置硬件参数来提升性能。
当然,在跑DL之前,无论什么框架,都需要把硬件性能提升到最高效,这样心里才平衡,因为只有这样才能不辜负花出去的白花花银子。

前景再现

这是没有进行硬件设置之前,GPU状态(效率非常低,一度怀疑自己的卡是矿卡)。

GPU很慢 pytorch gpu太慢_固态硬盘


进行一系列硬件设置之后GPU运行状态(两次运行的代码以及数据集都是相同的)。

GPU很慢 pytorch gpu太慢_性能提升_02

硬件设置

1、电源性能

找到控制面板->电源选项->选择高性能

GPU很慢 pytorch gpu太慢_数据集_03

2、显卡性能

开始菜单栏->NVIDIA Control Panel(显卡控制面板)

GPU很慢 pytorch gpu太慢_固态硬盘_04


拖动滑动条选择性能选项。

GPU很慢 pytorch gpu太慢_固态硬盘_05


配置PhysX,PhysX设置下选择自己的显卡,点击应用生效。

GPU很慢 pytorch gpu太慢_固态硬盘_06

3、BIOS CPU性能

进入BIOS,将CPU性能设置到最佳(不同品牌主板设置可能有区别,视自己的情况而设置,最终只要达到提升CPU性能的目的就好)。

GPU很慢 pytorch gpu太慢_GPU很慢 pytorch_07


根据我的CPU功能,开启涡轮加速模式(上图的Turbo-Model)

GPU很慢 pytorch gpu太慢_GPU很慢 pytorch_08

4、硬盘性能

如果有固态硬盘,最好将要处理的数据集存放在固态硬盘上,这样会提高数据交互效率。

一花独放不是春,百花齐放春满园! 让机器视觉应用满天下,解放人类的眼睛和大脑!