본문 바로가기
AI Framework/PyTorch

[PyTorch] 7주차: CNN (Convolutional Neural Network)

by cogito21_python 2024. 5. 30.
반응형

강의 목표

  • CNN의 기본 개념과 구조 이해
  • CNN 레이어 및 동작 원리 학습
  • PyTorch에서 CNN을 사용한 모델 구현 및 학습 방법 습득

강의 내용

1. CNN 개념

  • CNN이란 무엇인가?
    • CNN(Convolutional Neural Network)은 이미지 처리와 같은 시각적 데이터를 다루기 위해 설계된 신경망 구조입니다.
    • 전통적인 신경망보다 적은 파라미터로 이미지의 공간적 정보를 효과적으로 처리합니다.
  • CNN의 기본 원리
    • Convolution 연산: 이미지의 국소 특징을 추출
    • Pooling 연산: 특징 맵의 크기를 줄이고, 계산 비용을 감소시키며, 중요한 특징을 강조
  • CNN 레이어 설명
    • Convolutional Layer: 필터(커널)를 사용하여 특징 맵 생성
    • Pooling Layer: 다운샘플링을 통해 특징 맵 크기 축소 (예: Max Pooling)
    • Fully Connected Layer: 분류기 역할 수행

2. PyTorch에서 CNN 구현

  • torch.nn 모듈을 사용하여 CNN 레이어 구현
    • nn.Conv2d : 2D convolutional layer
    • nn.MaxPool2d : 2D max pooling layer
    • nn.ReLU : 활성화 함수
import torch
import torch.nn as nn
import torch.nn.functional as F

class SimpleCNN(nn.Module):
    def __init__(self):
        super(SimpleCNN, self).__init__()
        self.conv1 = nn.Conv2d(1, 32, kernel_size=3, padding=1)
        self.pool = nn.MaxPool2d(kernel_size=2, stride=2)
        self.conv2 = nn.Conv2d(32, 64, kernel_size=3, padding=1)
        self.fc1 = nn.Linear(64 * 7 * 7, 128)
        self.fc2 = nn.Linear(128, 10)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 64 * 7 * 7)  # Flatten the tensor
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        return x

 

3. CNN 모델 학습

  • 데이터셋 준비: MNIST 데이터셋 사용
    • MNIST 데이터셋은 손글씨 숫자 이미지로 구성되어 있으며, CNN 학습에 널리 사용됩니다.
    • torchvision.datasets 모듈을 사용하여 데이터셋 로드
     
import torchvision
import torchvision.transforms as transforms

# 데이터 전처리 변환
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))
])

# MNIST 데이터셋 로드
trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=32, shuffle=True)

testset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=32, shuffle=False)

 

  • 모델 학습 및 평가
    • 손실 함수와 옵티마이저 설정
    • 학습 루프 및 평가 루프 작성
     
# 모델, 손실 함수, 옵티마이저 설정
model = SimpleCNN()
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)

# 학습 루프
num_epochs = 5
for epoch in range(num_epochs):
    model.train()
    running_loss = 0.0
    for inputs, labels in trainloader:
        optimizer.zero_grad()
        outputs = model(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        running_loss += loss.item()

    print(f'Epoch {epoch+1}, Loss: {running_loss/len(trainloader)}')

# 모델 평가
model.eval()
correct = 0
total = 0
with torch.no_grad():
    for inputs, labels in testloader:
        outputs = model(inputs)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print(f'Accuracy: {100 * correct / total}%')

 

4. 실습 및 과제

  • 실습 과제
    • MNIST 데이터셋을 사용하여 간단한 CNN 모델을 구축하고 학습 및 평가
    • 모델의 구조를 변경해보며 성능을 비교
     
# 실습 과제 예시
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms

# 데이터 전처리 변환
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))
])

# MNIST 데이터셋 로드
trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=32, shuffle=True)

testset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=32, shuffle=False)

# 간단한 CNN 모델 정의
class SimpleCNN(nn.Module):
    def __init__(self):
        super(SimpleCNN, self).__init__()
        self.conv1 = nn.Conv2d(1, 32, kernel_size=3, padding=1)
        self.pool = nn.MaxPool2d(kernel_size=2, stride=2)
        self.conv2 = nn.Conv2d(32, 64, kernel_size=3, padding=1)
        self.fc1 = nn.Linear(64 * 7 * 7, 128)
        self.fc2 = nn.Linear(128, 10)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 64 * 7 * 7)  # Flatten the tensor
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        return x

model = SimpleCNN()

# 손실 함수와 옵티마이저 설정
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 모델 학습
num_epochs = 5
for epoch in range(num_epochs):
    model.train()
    running_loss = 0.0
    for inputs, labels in trainloader:
        optimizer.zero_grad()
        outputs = model(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        running_loss += loss.item()

    print(f'Epoch {epoch+1}, Loss: {running_loss/len(trainloader)}')

# 모델 평가
model.eval()
correct = 0
total = 0
with torch.no_grad():
    for inputs, labels in testloader:
        outputs = model(inputs)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print(f'Accuracy: {100 * correct / total}%')
  • 과제 제출
    • Jupyter Notebook 파일로 제출
    • 제출 기한: 다음 강의 시작 전까지
반응형