반응형
강의 목표
- CNN의 기본 개념과 구조 이해
- CNN 레이어 및 동작 원리 학습
- PyTorch에서 CNN을 사용한 모델 구현 및 학습 방법 습득
강의 내용
1. CNN 개념
- CNN이란 무엇인가?
- CNN(Convolutional Neural Network)은 이미지 처리와 같은 시각적 데이터를 다루기 위해 설계된 신경망 구조입니다.
- 전통적인 신경망보다 적은 파라미터로 이미지의 공간적 정보를 효과적으로 처리합니다.
- CNN의 기본 원리
- Convolution 연산: 이미지의 국소 특징을 추출
- Pooling 연산: 특징 맵의 크기를 줄이고, 계산 비용을 감소시키며, 중요한 특징을 강조
- CNN 레이어 설명
- Convolutional Layer: 필터(커널)를 사용하여 특징 맵 생성
- Pooling Layer: 다운샘플링을 통해 특징 맵 크기 축소 (예: Max Pooling)
- Fully Connected Layer: 분류기 역할 수행
2. PyTorch에서 CNN 구현
- torch.nn 모듈을 사용하여 CNN 레이어 구현
- nn.Conv2d : 2D convolutional layer
- nn.MaxPool2d : 2D max pooling layer
- nn.ReLU : 활성화 함수
import torch
import torch.nn as nn
import torch.nn.functional as F
class SimpleCNN(nn.Module):
def __init__(self):
super(SimpleCNN, self).__init__()
self.conv1 = nn.Conv2d(1, 32, kernel_size=3, padding=1)
self.pool = nn.MaxPool2d(kernel_size=2, stride=2)
self.conv2 = nn.Conv2d(32, 64, kernel_size=3, padding=1)
self.fc1 = nn.Linear(64 * 7 * 7, 128)
self.fc2 = nn.Linear(128, 10)
def forward(self, x):
x = self.pool(F.relu(self.conv1(x)))
x = self.pool(F.relu(self.conv2(x)))
x = x.view(-1, 64 * 7 * 7) # Flatten the tensor
x = F.relu(self.fc1(x))
x = self.fc2(x)
return x
3. CNN 모델 학습
- 데이터셋 준비: MNIST 데이터셋 사용
- MNIST 데이터셋은 손글씨 숫자 이미지로 구성되어 있으며, CNN 학습에 널리 사용됩니다.
- torchvision.datasets 모듈을 사용하여 데이터셋 로드
import torchvision
import torchvision.transforms as transforms
# 데이터 전처리 변환
transform = transforms.Compose([
transforms.ToTensor(),
transforms.Normalize((0.5,), (0.5,))
])
# MNIST 데이터셋 로드
trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=32, shuffle=True)
testset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=32, shuffle=False)
- 모델 학습 및 평가
- 손실 함수와 옵티마이저 설정
- 학습 루프 및 평가 루프 작성
# 모델, 손실 함수, 옵티마이저 설정
model = SimpleCNN()
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)
# 학습 루프
num_epochs = 5
for epoch in range(num_epochs):
model.train()
running_loss = 0.0
for inputs, labels in trainloader:
optimizer.zero_grad()
outputs = model(inputs)
loss = criterion(outputs, labels)
loss.backward()
optimizer.step()
running_loss += loss.item()
print(f'Epoch {epoch+1}, Loss: {running_loss/len(trainloader)}')
# 모델 평가
model.eval()
correct = 0
total = 0
with torch.no_grad():
for inputs, labels in testloader:
outputs = model(inputs)
_, predicted = torch.max(outputs.data, 1)
total += labels.size(0)
correct += (predicted == labels).sum().item()
print(f'Accuracy: {100 * correct / total}%')
4. 실습 및 과제
- 실습 과제
- MNIST 데이터셋을 사용하여 간단한 CNN 모델을 구축하고 학습 및 평가
- 모델의 구조를 변경해보며 성능을 비교
# 실습 과제 예시
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms
# 데이터 전처리 변환
transform = transforms.Compose([
transforms.ToTensor(),
transforms.Normalize((0.5,), (0.5,))
])
# MNIST 데이터셋 로드
trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=32, shuffle=True)
testset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=32, shuffle=False)
# 간단한 CNN 모델 정의
class SimpleCNN(nn.Module):
def __init__(self):
super(SimpleCNN, self).__init__()
self.conv1 = nn.Conv2d(1, 32, kernel_size=3, padding=1)
self.pool = nn.MaxPool2d(kernel_size=2, stride=2)
self.conv2 = nn.Conv2d(32, 64, kernel_size=3, padding=1)
self.fc1 = nn.Linear(64 * 7 * 7, 128)
self.fc2 = nn.Linear(128, 10)
def forward(self, x):
x = self.pool(F.relu(self.conv1(x)))
x = self.pool(F.relu(self.conv2(x)))
x = x.view(-1, 64 * 7 * 7) # Flatten the tensor
x = F.relu(self.fc1(x))
x = self.fc2(x)
return x
model = SimpleCNN()
# 손실 함수와 옵티마이저 설정
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)
# 모델 학습
num_epochs = 5
for epoch in range(num_epochs):
model.train()
running_loss = 0.0
for inputs, labels in trainloader:
optimizer.zero_grad()
outputs = model(inputs)
loss = criterion(outputs, labels)
loss.backward()
optimizer.step()
running_loss += loss.item()
print(f'Epoch {epoch+1}, Loss: {running_loss/len(trainloader)}')
# 모델 평가
model.eval()
correct = 0
total = 0
with torch.no_grad():
for inputs, labels in testloader:
outputs = model(inputs)
_, predicted = torch.max(outputs.data, 1)
total += labels.size(0)
correct += (predicted == labels).sum().item()
print(f'Accuracy: {100 * correct / total}%')
- 과제 제출
- Jupyter Notebook 파일로 제출
- 제출 기한: 다음 강의 시작 전까지
반응형
'AI Framework > PyTorch' 카테고리의 다른 글
[PyTorch] 9주차: 모델 최적화 및 고급 주제 (0) | 2024.05.30 |
---|---|
[PyTorch] 8주차: 고급 주제 및 프로젝트 (0) | 2024.05.30 |
[PyTorch] 6주차: 모델 훈련 및 평가 (0) | 2024.05.30 |
[PyTorch] 5주차: 데이터셋 및 DataLoader (0) | 2024.05.30 |
[PyTorch] 4주차: 신경망 기본 구조 (0) | 2024.05.30 |