pytorch将模块的大小改变

原创

mob64ca12db3721 2024-10-04 07:26:58 ©著作权

文章标签 2d python 分析模型 文章分类 PyTorch 人工智能

©著作权归作者所有：来自51CTO博客作者mob64ca12db3721的原创作品，请联系作者获取转载授权，否则将追究法律责任

PyTorch 中改变模块大小的流程与步骤

在深度学习开发中，我们常常需要根据特定需求调整模型的大小（即改变网络层的深度或宽度）。在本篇文章中，我将详细介绍如何在 PyTorch 中实现这一功能。这包括整体流程、所需步骤、相关代码示例以及注释说明。

整体流程

以下是实现修改 PyTorch 模块大小的基本流程：

步骤	描述
1	定义原始模型
2	分析模型结构
3	创建新模型
4	移植参数（可选）
5	验证新模型

每一步的详细指导

1. 定义原始模型

我们首先定义一个基本的模型。以下是一个简单的卷积神经网络（CNN）示例。

import torch
import torch.nn as nn
import torch.nn.functional as F

# 定义原始模型
class OriginalModel(nn.Module):
    def __init__(self):
        super(OriginalModel, self).__init__()
        self.conv1 = nn.Conv2d(1, 6, 5)  # 输入通道1，输出通道6，卷积核5x5
        self.conv2 = nn.Conv2d(6, 16, 5)  # 输入通道6，输出通道16，卷积核5x5
        self.fc1 = nn.Linear(16*4*4, 120)  # 线性层
        self.fc2 = nn.Linear(120, 84)  # 线性层
        self.fc3 = nn.Linear(84, 10)  # 输出层

    def forward(self, x):
        x = F.relu(self.conv1(x))
        x = F.max_pool2d(x, 2)
        x = F.relu(self.conv2(x))
        x = F.max_pool2d(x, 2)
        x = x.view(-1, self.num_flat_features(x))  # 展平
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

    def num_flat_features(self, x):
        size = x.size()[1:]  # 除去批次维度
        num_features = 1
        for s in size:
            num_features *= s  # 计算扁平化后的特征数量
        return num_features

2. 分析模型结构

在分析模型结构时，我们可以使用 summary 函数或手动查看每一层的参数。了解每一层的输入输出维度非常重要，这可以帮助我们在创建新模型时保留所需层的特性。

3. 创建新模型

现在，我们将根据需求创建一个新的模型。在这里，我们假设我们希望增加某一层的输出通道数。

# 定义新的模型
class NewModel(nn.Module):
    def __init__(self):
        super(NewModel, self).__init__()
        self.conv1 = nn.Conv2d(1, 12, 5)  # 输出通道数改变
        self.conv2 = nn.Conv2d(12, 32, 5)  # 输出通道数改变
        self.fc1 = nn.Linear(32*4*4, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = F.relu(self.conv1(x))
        x = F.max_pool2d(x, 2)
        x = F.relu(self.conv2(x))
        x = F.max_pool2d(x, 2)
        x = x.view(-1, self.num_flat_features(x))
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

    def num_flat_features(self, x):
        size = x.size()[1:]
        num_features = 1
        for s in size:
            num_features *= s
        return num_features

4. 移植参数（可选）

若希望保留原始模型的学习参数，你需要将参数加载到新模型中，注意修改后的层不可以直接加载参数。

# 初始化模型
original_model = OriginalModel()
new_model = NewModel()

# 移植参数
new_model.conv1.weight.data[:6].copy_(original_model.conv1.weight.data)  # 只拷贝前6个通道的权重
new_model.conv2.weight.data[:16].copy_(original_model.conv2.weight.data)  # 这样的基于通道的拷贝

5. 验证新模型

最后，我们可以通过前向传播来验证新的模型是否正常工作。

# 验证新模型
input_data = torch.randn(1, 1, 28, 28)  # 假设输入形状为 (1, 1, 28, 28)
output = new_model(input_data)
print(output)

类图

下面是使用 mermaid 语法展示的简单类图，模型的关系一目了然。

classDiagram
    class OriginalModel {
      -conv1: Conv2d
      -conv2: Conv2d
      -fc1: Linear
      -fc2: Linear
      -fc3: Linear
      +forward(x)
    }
    class NewModel {
      -conv1: Conv2d
      -conv2: Conv2d
      -fc1: Linear
      -fc2: Linear
      -fc3: Linear
      +forward(x)
    }
    OriginalModel <|-- NewModel