PyTorch官方Tutorials

跟着PyTorch官方Tutorials码的,便于理解自己稍有改动代码并添加注释,IDE用的jupyter notebook

链接: SAVE AND LOAD THE MODEL

PyTorch 时序数据 准备 pytorch load数据_加载

保存与加载模型

通过保存,加载,预测模型来保存模型状态

import torch
import torch.onnx as onnx
import torchvision.models as models

PyTorch 时序数据 准备 pytorch load数据_2d_02

保存与加载模型权重

pytorch模型在内部状态字典保存习得的参数,这个字典叫做state_dict.这些可以通过torch.save方法来保存:

model=models.vgg16(pretrained=True)
torch.save(model.state_dict(),'model_weights.pth')

PyTorch 时序数据 准备 pytorch load数据_PyTorch 时序数据 准备_03

加载模型权重时,需要先创建一个同模型的实例,然后通过使用load_state_dict()方法来加载参数

model=models.vgg16() #这里没有特别声明 pretrained=True 因此不会加载默认权重
model.load_state_dict(torch.load('model_weights.pth'))
model.eval()
VGG(
  (features): Sequential(
    (0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU(inplace=True)
    (2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU(inplace=True)
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (6): ReLU(inplace=True)
    (7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (8): ReLU(inplace=True)
    (9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (11): ReLU(inplace=True)
    (12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (13): ReLU(inplace=True)
    (14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (15): ReLU(inplace=True)
    (16): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (17): Conv2d(256, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (18): ReLU(inplace=True)
    (19): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (20): ReLU(inplace=True)
    (21): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (22): ReLU(inplace=True)
    (23): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (24): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (25): ReLU(inplace=True)
    (26): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (27): ReLU(inplace=True)
    (28): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (29): ReLU(inplace=True)
    (30): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  )
  (avgpool): AdaptiveAvgPool2d(output_size=(7, 7))
  (classifier): Sequential(
    (0): Linear(in_features=25088, out_features=4096, bias=True)
    (1): ReLU(inplace=True)
    (2): Dropout(p=0.5, inplace=False)
    (3): Linear(in_features=4096, out_features=4096, bias=True)
    (4): ReLU(inplace=True)
    (5): Dropout(p=0.5, inplace=False)
    (6): Linear(in_features=4096, out_features=1000, bias=True)
  )
)

PyTorch 时序数据 准备 pytorch load数据_ide_04

确保在预测前调用model.eval()方法来讲dropout和batch normalization层设置为评估模式.不这样做的话将会导致预测结果不一致.

PyTorch 时序数据 准备 pytorch load数据_ide_05

将模型参数和结构一起保存

加载模型权重时,需要先实例化模型类,因为类定义了网络的结构.我们可能会想要和模型一起保存类的结构,此时只需将model(不是model.state_dict())传入保存函数:

torch.save(model,'model.pth')

可以这样加载模型:

model=torch.load('model.pth')

PyTorch 时序数据 准备 pytorch load数据_2d_06

这个方式在序列化模型时使用了python的pickle模块,因此它依赖于加载模型时可用的实际类的定义.

这句没咋理解

PyTorch 时序数据 准备 pytorch load数据_ide_07

将模型导出到ONNX

pytorch也支持原始?ONNX导出.但是,考虑到pytorch本身的动态计算图,导出过程必须遍历计算图来产生一个持续的ONNX模型.出于这个原因,合适大小的测试变量应当传入导出例程(本例中使用一个正确大小的零张量):

input_image=torch.zeros((1,3,244,244))
onnx.export(model,input_image,'model.onnx')

PyTorch 时序数据 准备 pytorch load数据_ide_08