以下是一个简单的 PyTorch 演示,展示如何构建一个基础的神经网络模型(以分类任务为例),包括数据加载、模型定义、训练和评估的完整流程:


PyTorch 基础演示:手写数字分类(MNIST)

import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms
from torch.utils.data import DataLoader

# 1. 数据准备
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))  # 归一化到 [-1, 1]
])

train_dataset = datasets.MNIST(
    root='./data', train=True, download=True, transform=transform
)
test_dataset = datasets.MNIST(
    root='./data', train=False, download=True, transform=transform
)

train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=64, shuffle=False)

# 2. 定义模型
class SimpleNN(nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        self.flatten = nn.Flatten()
        self.fc1 = nn.Linear(28*28, 128)  # 输入层到隐藏层
        self.relu = nn.ReLU()
        self.fc2 = nn.Linear(128, 10)     # 隐藏层到输出层(10类)

    def forward(self, x):
        x = self.flatten(x)
        x = self.fc1(x)
        x = self.relu(x)
        x = self.fc2(x)
        return x

model = SimpleNN()

# 3. 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 4. 训练模型
num_epochs = 5
for epoch in range(num_epochs):
    model.train()
    for images, labels in train_loader:
        # 前向传播
        outputs = model(images)
        loss = criterion(outputs, labels)

        # 反向传播和优化
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

    print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}')

# 5. 评估模型
model.eval()
correct = 0
total = 0
with torch.no_grad():
    for images, labels in test_loader:
        outputs = model(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print(f'Test Accuracy: {100 * correct / total:.2f}%')

关键点说明

  1. 数据加载

    • 使用 torchvision.datasets.MNIST 加载手写数字数据集。
    • DataLoader 实现批量加载和打乱数据(shuffle=True)。
  2. 模型定义

    • 继承 nn.Module,定义网络结构(全连接层 + ReLU激活函数)。
    • forward() 方法描述数据流向。
  3. 训练流程

    • 前向传播计算损失,反向传播更新权重(optimizer.step())。
    • 每个epoch打印训练损失。
  4. 评估

    • 在测试集上计算准确率,注意关闭梯度计算(torch.no_grad())。

扩展功能

  • 使用CNN:替换 SimpleNN 为卷积网络(如 nn.Conv2d)提升性能。
  • GPU加速:将模型和数据移动到GPU(model.to('cuda'))。
  • 保存/加载模型:使用 torch.save(model.state_dict(), 'model.pth') 保存权重。

如果需要更复杂的示例(如CNN、RNN或自定义数据集),可以进一步说明需求!

Logo

开源鸿蒙跨平台开发社区汇聚开发者与厂商,共建“一次开发,多端部署”的开源生态,致力于降低跨端开发门槛,推动万物智联创新。

更多推荐