본문 바로가기
728x90
[PyTorch] 주요 개념 PyTorch는 페이스북의 AI 연구팀에서 개발한 오픈 소스 딥러닝 프레임워크로, 특히 연구와 개발 환경에서 많이 사용됩니다. PyTorch는 텐서 계산 및 동적 계산 그래프를 기반으로 하며, 이를 통해 복잡한 모델을 쉽게 설계하고 디버깅할 수 있습니다. PyTorch의 핵심 개념과 기능을 소개하겠습니다.1. 텐서(Tensor)텐서는 PyTorch의 기본 데이터 구조입니다. 텐서는 N차원의 배열로, 수학적 연산을 수행하는 데 사용됩니다.텐서는 torch.Tensor 클래스를 사용하여 생성할 수 있습니다. 예를 들어, 2x3 행렬을 생성하려면 다음과 같습니다.import torchx = torch.Tensor([[1, 2, 3], [4, 5, 6]])2. 자동 미분(Autograd)Autograd는 PyT.. 2024. 6. 8.
[CV] U-Net [출처]: U-Net: Convolutional Networks for Biomedical Image Segmentation U-Net: 생의학 이미지 분할을 위한 컨볼루션 네트워크저자:Olaf Ronneberger, Philipp Fischer, Thomas Brox독일 프라이부르크 대학교요약:이 논문은 생의학 이미지 분할을 위한 컨볼루션 네트워크 구조와 훈련 전략을 소개합니다. 주요 특징은 다음과 같습니다:주석이 달린 샘플을 효율적으로 사용하기 위한 데이터 증강.맥락을 포착하는 수축 경로와 정밀한 위치 지정이 가능한 확장 경로를 가진 대칭 아키텍처.몇 개의 이미지로부터 엔드 투 엔드로 훈련 가능, 이전 방법보다 뛰어난 성능.빠른 분할 능력 (최근 GPU에서 512x512 이미지 분할이 1초 이내).구.. 2024. 6. 7.
[CV] Deformable Convolutional Networks [출처]: Deformable Convolutional Networks  "Deformable Convolutional Networks" 요약저자: Jifeng Dai, Haozhi Qi, Yuwen Xiong, Yi Li, Guodong Zhang, Han Hu, Yichen Wei소속: Microsoft Research Asia요약: 컨볼루션 신경망(CNN)은 고정된 기하 구조로 인해 기하 변환을 모델링하는 데 어려움을 겪습니다. 이를 해결하기 위해 저자들은 변형 가능 컨볼루션(deformable convolution)과 변형 가능 RoI 풀링(deformable RoI pooling)을 도입했습니다. 이 모듈들은 추가적인 감독 없이 대상 작업에서 학습된 오프셋을 기반으로 공간 샘플링 위치를 조정하여.. 2024. 6. 7.
[CV] Cascade R-CNN [출처]: Cascade R-CNN: Delving into High Quality Object Detection 요약:논문 "Cascade R-CNN: Delving into High Quality Object Detection"은 객체 검출 성능을 향상시키기 위한 새로운 접근 방식을 소개합니다.요약:Cascade R-CNN은 훈련 중 과적합 문제와 추론 중 품질 불일치 문제를 해결하기 위해 고안된 다단계 객체 검출 프레임워크입니다. 낮은 교차 비율(IoU) 임계값으로 훈련된 전통적인 객체 검출기는 종종 잡음이 많은 검출 결과를 만듭니다. 훈련 중에 IoU 임계값을 높이는 것은 양성 샘플의 감소와 검출기의 최적 IoU와 입력 가설 간의 불일치로 인해 성능 저하를 초래할 수 있습니다.주요 기여:다단계 아.. 2024. 6. 7.
[CV] EfficientDet [출처]: EfficientDet: Scalable and Efficient Object Detection "EfficientDet: Scalable and Efficient Object Detection" 요약이 논문은 효율성과 확장성을 염두에 두고 설계된 새로운 객체 탐지기 모델 군인 EfficientDet을 소개합니다. 주요 기여는 다음과 같습니다:BiFPN (양방향 피라미드 네트워크): EfficientDet은 효율적이고 빠른 다중 스케일 특징 융합을 가능하게 하는 가중 양방향 피라미드 네트워크(BiFPN)를 도입합니다. BiFPN은 학습 가능한 가중치를 사용하여 다양한 입력 특징의 중요도를 결정하여 융합 과정을 향상시킵니다.복합 스케일링 방법: 이 논문은 백본, 특징 네트워크, 박스/클래스 예측.. 2024. 6. 7.
[CV] EfficientNet [출처]: EfficientNet: Rethinking Model Scaling for Convolutional Neural NetworksEfficientNet: 합성곱 신경망의 모델 확장을 재고하다저자: Mingxing Tan, Quoc V. Le초록: EfficientNet은 합성곱 신경망(ConvNet)의 깊이, 너비, 해상도를 복합 계수를 사용하여 균형 있게 확장하는 새로운 방법을 제안합니다. 저자들은 모델 확장을 체계적으로 연구하고, 모든 차원을 균일하게 확장함으로써 더 나은 성능을 달성할 수 있음을 보여줍니다. 그들은 신경망 아키텍처 검색을 통해 새로운 기본 네트워크 EfficientNet을 설계하고, 이를 확장하여 이전의 ConvNet보다 더 나은 정확도와 효율성을 가진 모델들을 얻습니다... 2024. 6. 7.
[CV] RetinaNet [출처]: Focal Loss for Dense Object DetectionRetinaNet 요약저자: Tsung-Yi Lin, Priya Goyal, Ross Girshick, Kaiming He, Piotr Dollar소속: Facebook AI Research (FAIR)초록이 논문은 COCO 벤치마크에서 최첨단 정확도를 달성하는 1단계 객체 탐지기인 RetinaNet을 소개합니다. 주요 혁신은 Focal Loss로, 이는 훈련 중에 발생하는 극단적인 전경-배경 클래스 불균형 문제를 해결하기 위해 설계되었습니다.소개현재 최첨단 객체 탐지기는 2단계 접근 방식(예: R-CNN)에 의존합니다. 1단계 탐지기는 더 빠르고 단순하지만 정확도에서 뒤처져 왔습니다. 이 논문은 클래스 불균형을 주요 문제로 식.. 2024. 6. 7.
[CV] SPPNet [출처]: Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition요약: Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition소개문제점: 기존의 심층 합성곱 신경망(CNN)은 고정된 크기의 입력 이미지를 필요로 하며, 이는 다양한 크기와 비율의 이미지를 처리하는 데 제한이 있다. 이를 해결하기 위해 이미지의 크기를 자르거나 왜곡하여 고정된 크기로 맞추지만, 이는 인식 정확도를 떨어뜨릴 수 있다.해결책: 공간 피라미드 풀링(SPP) 레이어를 도입하여 고정 크기의 입력 제약을 제거하고, 다양한 크기와 비율의 이미지를 처리할 수 있는 SPP-n.. 2024. 6. 7.
[CV] FPN [출처]: Feature Pyramid Networks for Object Detection  문서는 Feature Pyramid Networks(FPN)와 이들의 객체 탐지 및 분할에 대한 응용에 대해 다루고 있습니다. 주요 내용을 요약하면 다음과 같습니다:Feature Pyramids 소개:전통적인 이미지 피라미드는 메모리 제약과 훈련 및 테스트 간의 불일치로 인해 엔드 투 엔드 훈련에 적합하지 않습니다.ConvNet의 내재된 다중 스케일, 피라미드형 특징 계층을 활용하여 다중 스케일 특징 표현을 할 수 있습니다.Single Shot Detector(SSD):SSD는 ConvNet의 특징 계층을 사용하지만 작은 객체를 탐지하는 데 중요한 고해상도 맵을 재사용하지 못합니다.Feature Pyramid .. 2024. 6. 7.
[PyTorch] 20주차: 최신 딥러닝 연구 및 기술 동향 강의 목표최신 딥러닝 연구 동향 및 기술 트렌드 이해최신 기술 및 도구의 적용 방법 학습실전 프로젝트를 통해 최신 기술을 활용한 모델 개발 경험강의 내용1. 최신 딥러닝 연구 동향연구 동향 개요딥러닝의 발전과 주요 연구 분야최신 연구 동향 소개주요 연구 분야자율주행의료 영상 분석자연어 처리(NLP)강화 학습(Reinforcement Learning)생성 모델(Generative Models)2. 자연어 처리(NLP) 최신 기술Transformer 기반 모델Transformer 개념 및 구조BERT, GPT 등의 최신 언어 모델BERT를 활용한 문서 분류 예제from transformers import BertTokenizer, BertForSequenceClassificationfrom transform.. 2024. 5. 31.
반응형