计算深度学习模型的推理时间、fps

原创

Aclous 2022-04-29 15:42:33 博主文章分类：深度学习 ©著作权

文章标签 python 深度学习 sed csdn博客 github 文章分类 Java 后端开发

©著作权归作者所有：来自51CTO博客作者Aclous的原创作品，请联系作者获取转载授权，否则将追究法律责任

背景

代码

参考：

背景

评估模型的推理时间时有需要注意的地方。如torch.cuda.synchronize()，因为pytorch代码执行时异步的，使用该代码会等待gpu上所有操作结束后再接着运行代码、计算时间等【1】。

代码

函数【2】：

import time
def measure_inference_speed(model, data, max_iter=200, log_interval=50):
    model.eval（)

    # the first several iterations may be very slow so skip them
    num_warmup = 5
    pure_inf_time = 0
    fps = 0

    # benchmark with 2000 image and take the average
    for i in range(max_iter):

        torch.cuda.synchronize()
        start_time = time.perf_counter()

        with torch.no_grad():
            model(*data)

        torch.cuda.synchronize()
        elapsed = time.perf_counter() - start_time

        if i >= num_warmup:
            pure_inf_time += elapsed
            if (i + 1) % log_interval == 0:
                fps = (i + 1 - num_warmup) / pure_inf_time
                print(
                    f'Done image [{i + 1:<3}/ {max_iter}], '
                    f'fps: {fps:.1f} img / s, '
                    f'times per image: {1000 / fps:.1f} ms / img',
                    flush=True)

        if (i + 1) == max_iter:
            fps = (i + 1 - num_warmup) / pure_inf_time
            print(
                f'Overall fps: {fps:.1f} img / s, '
                f'times per image: {1000 / fps:.1f} ms / img',
                flush=True)
            break
    return fps

调用【2】：

import measure_inference_speed
net = net.cuda()
data = torch.randn((1, 6, 128, 128)).cuda()
measure_inference_speed(net, (data,))

上一篇：计算深度学习模型的参数量、复杂度

下一篇：制作论文图示、论文图像的脚本、细节放大并合成一张图

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

计算深度学习模型的推理时间、fps

计算深度学习模型的推理时间、fps

背景

代码

​

51CTO博客