这里在我写的 Pytorch:一个简单的神经网络——分类 的基础上进行对模型的保存和提取操作。

为了检验保存的模型就是训练好的模型,先用训练好的模型做个测试

print(net(torch.tensor([2., 5.])))	# 用模型判断(2,5)这个点所属的类别
# tensor([0.9701, 0.0299], grad_fn=<SoftmaxBackward>)	# 数据0、1两个类的概率

Pytorch对模型的报讯提取有两种方式

  • torch.save(net, 'classnet.pkl')这种方式将会保存整个模型,包括模型的结构和参数
# 保存
torch.save(net, 'data/models/classnet.pkl')     # 保存整个网络(结构+参数)
# 提取
net2=torch.load('data/models/classnet.pkl')
# 使用demo
print(net2(torch.tensor([2., 5.])))		# 通过模型判断(2,5)这个点的类别
# tensor([0.9701, 0.0299], grad_fn=<SoftmaxBackward>)	# 属于0、1两个类别的概率
print(net2(torch.tensor([3., 5.])))
# tensor([0.9883, 0.0117], grad_fn=<SoftmaxBackward>)
  • torch.save(net.state_dict(), 'classnet_params.pkl')这种方式只保存模型的参数,保存和提取过程的速度会快一些,就是重构的时候需要重新定义模型的结构
# 保存
torch.save(net.state_dict(), 'data/models/classnet_params.pkl')  # 只保存网络中的参数 (速度快, 占内存少)
# 提取
net3=Net(n_feature=2, n_hidden=10, n_output=2)
net3.load_state_dict(torch.load('data/models/classnet_params.pkl'))	# 将保存的参数复制到 net3
# 使用demo
print(net3(torch.tensor([2., 5.])))
# tensor([0.9701, 0.0299], grad_fn=<SoftmaxBackward>)
print(net3(torch.tensor([3., 2.])))
# tensor([0.9694, 0.0306], grad_fn=<SoftmaxBackward>)

这里因为在同一个文件中进行了模型提取,在重构模型是,可以用net3=Net(n_feature=2, n_hidden=10, n_output=2)直接进行重构,这利用了上面写的Net类,如果在另一个py文件中进行模型文件的提取,就需要重新写这个类,或者import一下这个类,或者通过torch.nn.Sequential()方法快速构建模型结构。

然后通过画图的方式直观看一下三个模型(一开始训练的、方式1保存的和方式2保存的)

pytorch 模型文件 pytorch 模型保存_保存

可以看到三个模型的对数据的分类结果是相同的,画图可参见 Matplotlib

最后附上所有代码

import torch
import torch.nn.functional as F     # 激励函数都在这
import matplotlib.pyplot as plt

torch.manual_seed(0)    # 为了使每次随机生成的数据都是一样的

# 生成训练数据
n_data = torch.ones(100, 2)  # 数据的基本形态,全1矩阵,shape=(100,2)
x0 = torch.normal(2 * n_data, 1)  # 类型0 x data (tensor), shape=(100, 2)
y0 = torch.zeros(100)  # 类型0 y data (tensor), shape=(100, )
x1 = torch.normal(-2 * n_data, 1)  # 类型1 x data (tensor), shape=(100, 1)
y1 = torch.ones(100)  # 类型1 y data (tensor), shape=(100, )

# 注意 x, y 数据的数据形式是一定要像下面一样 (torch.cat 是在合并数据)
x = torch.cat((x0, x1), 0)
y = torch.cat((y0, y1), 0).type(torch.long)
# 为y改变一下数据类型,因为网络的输出结果是long类型,在计算loss时需要匹配

class Net(torch.nn.Module):

    def __init__(self, n_feature, n_hidden, n_output):
        super(Net, self).__init__()  # 继承 __init__ 功能
        self.hidden = torch.nn.Linear(n_feature, n_hidden)  # 隐藏层线性输出
        self.predict = torch.nn.Linear(n_hidden, n_output)  # 输出层线性输出

    def forward(self, x):  # 这同时也是 Module 中的 forward 功能
        x = F.relu(self.hidden(x))  # 激励函数(隐藏层的线性值)
        y = F.softmax(self.predict(x))  # 输出值

        return y

if __name__ == '__main__':

    # 声明一个网络
    net = Net(n_feature=2, n_hidden=10, n_output=2)

    # optimizer 是训练的工具
    optimizer = torch.optim.SGD(net.parameters(), lr=0.02)
    loss_func = torch.nn.CrossEntropyLoss()

    for t in range(100):
        res = net(x)  # 喂给 net 训练数据 x, 输出分析值

        loss = loss_func(res, y)  # 计算两者的误差

        optimizer.zero_grad()  # 清空上一步的残余更新参数值
        loss.backward()  # 误差反向传播, 计算参数更新值
        optimizer.step()  # 将参数更新值施加到 net 的 parameters 上

    plt.figure(figsize=(12,4))

    prediction = torch.max(net(x), 1)[1]
    plt.subplot(131, title='net')
    plt.scatter(x[:, 0], x[:, 1], c=prediction, lw=0, cmap='RdYlGn')

    torch.save(net, 'data/models/classnet.pkl')     # 保存整个网络(结构+参数)
    torch.save(net.state_dict(), 'data/models/classnet_params.pkl')  # 只保存网络中的参数 (速度快, 占内存少)

    net2=torch.load('data/models/classnet.pkl')

    prediction2 = torch.max(net2(x), 1)[1]
    plt.subplot(132, title='net2')
    plt.scatter(x[:, 0], x[:, 1], c=prediction2, lw=0, cmap='RdYlGn')

    net3=Net(n_feature=2, n_hidden=10, n_output=2)
    # 将保存的参数复制到 net3
    net3.load_state_dict(torch.load('data/models/classnet_params.pkl'))

    prediction3 = torch.max(net3(x), 1)[1]
    plt.subplot(133, title='net3')
    plt.scatter(x[:, 0], x[:, 1], c=prediction3, lw=0, cmap='RdYlGn')


    print(net(torch.tensor([2., 5.])))
    print(net2(torch.tensor([2., 5.])))
    print(net2(torch.tensor([3., 5.])))
    print(net3(torch.tensor([2., 5.])))
    print(net3(torch.tensor([3., 2.])))

    plt.show()

参考文献

保存提取