LSTM 如何处理多维输入 pytorch

原创

mob64ca12dfd1d5 2024-12-29 04:28:13 ©著作权

文章标签 数据数据加载 python 文章分类 PyTorch 人工智能

©著作权归作者所有：来自51CTO博客作者mob64ca12dfd1d5的原创作品，请联系作者获取转载授权，否则将追究法律责任

使用 LSTM 处理多维输入的实际案例

长短期记忆网络（LSTM）是一种特殊的递归神经网络（RNN），能够捕捉时序数据中的依赖关系。另一方面，现实中的许多数据是多维的，例如，在金融市场中，股票的开盘价、最高价、最低价和收盘价都是连续变化的时间序列。如何将这些多维输入喂入LSTM模型，是一个值得探讨的问题。

在这篇文章中，我们将探讨如何在 PyTorch 中使用 LSTM 处理多维输入，以预测股票价格。

1. 问题背景

假设我们要基于过去几天的股票价格数据（开盘价、最高价、最低价、收盘价）来预测下一天的开盘价。数据集中的每条数据都包含这四个维度的信息（4D）。因此，我们将使用一个四维的输入数据到LSTM中。

2. 数据准备

首先，我们需要准备数据。在本示例中，我们将生成一些示例数据并将其格式化为适合LSTM的格式。

import numpy as np
import torch
from torch.utils.data import DataLoader, TensorDataset

# 生成样本数据 (100天)
np.random.seed(42)
data = np.random.rand(100, 4)  # 4维输入: [开盘价, 最高价, 最低价, 收盘价]
data_tensor = torch.FloatTensor(data)

# 准备输入和目标
X = []
y = []
for i in range(len(data) - 1):
    X.append(data[i:i+10])  # 10天作为输入
    y.append(data[i+1][0])  # 下一天的开盘价作为目标

X_tensor = torch.FloatTensor(X)
y_tensor = torch.FloatTensor(y)

# 创建数据集和数据加载器
dataset = TensorDataset(X_tensor, y_tensor)
dataloader = DataLoader(dataset, batch_size=5, shuffle=True)

3. 构建 LSTM 模型

接下来，我们构建一个LSTM模型。该模型将输入大小设置为4（即四个维度），隐藏层大小可根据需要调整。

import torch.nn as nn

class LSTMModel(nn.Module):
    def __init__(self, input_size, hidden_size, output_size):
        super(LSTMModel, self).__init__()
        self.lstm = nn.LSTM(input_size, hidden_size)
        self.fc = nn.Linear(hidden_size, output_size)

    def forward(self, x):
        lstm_out, _ = self.lstm(x)
        predictions = self.fc(lstm_out[-1])  # 取最后一个时间步的输出
        return predictions

# 参数设定
input_size = 4   # 四个维度
hidden_size = 32  # 隐藏层的单元数
output_size = 1  # 预测的开盘价

# 初始化模型、损失函数和优化器
model = LSTMModel(input_size, hidden_size, output_size)
criterion = nn.MSELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)

4. 训练模型

接下来，我们训练模型。

num_epochs = 50

for epoch in range(num_epochs):
    for inputs, targets in dataloader:
        optimizer.zero_grad()
        outputs = model(inputs.view(-1, 10, input_size))
        loss = criterion(outputs.view(-1), targets)
        loss.backward()
        optimizer.step()
    
    if (epoch + 1) % 10 == 0:
        print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}')

5. 状态图

状态图可以帮助我们理解LSTM模型的工作流程。以下是LSTM状态图的描述：

stateDiagram
    direction LR
    state "输入数据" as Input
    state "LSTM 处理" as LSTM_Process
    state "全连接层输出" as Output
    state "损失计算" as Loss
    state "优化参数" as Optimize

    Input --> LSTM_Process
    LSTM_Process --> Output
    Output --> Loss
    Loss --> Optimize

6. 旅行图

当我们执行训练时，可以用旅行图的方式展示学习过程。以下是旅行流程的示例：

journey
    title LSTM 训练过程
    section 数据准备
      准备输入数据: 5: 数据输入完成
      数据加载: 3: 数据加载完成
    section 训练模型
      参数初始化: 4: 参数设置完成
      迭代更新: 4: 模型训练进行中
      损失计算: 3: 损失正在计算中