Variable pytorch

原创

mob64ca12ebf2cc 2023-10-08 12:31:51 ©著作权

文章标签 python 损失函数封装 文章分类 PyTorch 人工智能

©著作权归作者所有：来自51CTO博客作者mob64ca12ebf2cc的原创作品，请联系作者获取转载授权，否则将追究法律责任

Variable pytorch

Variable是pytorch中的一个重要概念，它是用来封装tensor的类，同时还具有自动求导的功能。在深度学习中，自动求导是一个非常重要的功能，它可以帮助我们自动计算损失函数对参数的梯度，从而优化模型。本文将介绍Variable的基本用法，并通过代码示例详细说明。

Variable的基本用法

Variable是torch.autograd中的一个类，它可以用来包装一个tensor，并记录对该tensor的操作。通过Variable创建的tensor可以进行自动求导，即调用backward()函数时，会自动计算梯度。

首先，我们需要导入必要的库，并创建一个tensor：

import torch
from torch.autograd import Variable

x = torch.tensor([1.0, 2.0, 3.0], requires_grad=True)

上面的代码中，我们创建了一个大小为3的tensor，并将其封装在Variable中。requires_grad=True表示我们希望对该tensor进行求导。

接下来，我们可以对Variable进行各种操作，比如加法、乘法等：

y = x + 2
z = y * y * 3
out = z.mean()

上面的代码中，我们定义了一些新的Variable（y、z和out），并进行了一系列的操作。需要注意的是，这些操作都是基于原始的tensor（x）进行的，但是它们都会自动被记录下来，用于后续的梯度计算。

最后，我们可以调用backward()函数进行梯度计算，并查看梯度：

out.backward()
print(x.grad)

上面的代码中，我们调用了out的backward()函数，自动计算了损失函数对x的梯度，并将结果保存在x.grad中。我们可以打印出x.grad来查看梯度的值。

需要注意的是，如果我们对一个Variable进行多次backward()操作，梯度将会累加。如果希望每次backward()操作后都清零梯度，可以使用zero_()函数：

x.grad.zero_()

Variable的应用示例

下面通过一个简单的线性回归问题，来演示Variable的应用。

首先，我们生成一些随机数据，并创建两个Variable对象：

import torch
from torch.autograd import Variable

# 随机生成一些数据
x_data = torch.tensor([[1.0], [2.0], [3.0]])
y_data = torch.tensor([[2.0], [4.0], [6.0]])

# 创建Variable对象
x = Variable(x_data, requires_grad=False)
y = Variable(y_data, requires_grad=False)

上面的代码中，我们使用torch.tensor生成了一些随机的输入和输出数据，并将它们封装在Variable中。requires_grad=False表示我们不需要对这些Variable进行求导。

接下来，我们定义一个简单的线性模型：

class LinearModel(torch.nn.Module):
    def __init__(self):
        super(LinearModel, self).__init__()
        self.linear = torch.nn.Linear(1, 1)
    
    def forward(self, x):
        y_pred = self.linear(x)
        return y_pred

model = LinearModel()

上面的代码中，我们定义了一个继承自torch.nn.Module的线性模型，其中包含一个线性层torch.nn.Linear。forward函数定义了模型的前向传播过程。

接下来，我们定义损失函数和优化器：

criterion = torch.nn.MSELoss()
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

上面的代码中，我们选择均方误差（MSE）作为损失函数，使用随机梯度下降（SGD）作为优化器，学习率为0.01。

最后，我们进行模型的训练：

for epoch in range(100):
    # forward计算
    y_pred = model(x)
    
    # 计算损失函数
    loss = criterion(y_pred, y)
    
    # 梯度清零
    optimizer.zero_grad()
    
    # backward计算
    loss.backward()
    
    # 更新权重
    optimizer.step()
    
    if (epoch+1) % 10 == 0:
        print('Epoch [{