본문 바로가기
반응형
[개발 기본 규칙] C++ 프로젝트 구조 C++ 프로젝트의 구조를 잘 정의하는 것은 코드의 가독성과 유지보수성을 높이는 데 매우 중요합니다. 아래는 일반적인 C++ 프로젝트 구조와 관련된 규칙입니다.프로젝트 디렉토리 구조src/: 소스 파일을 저장하는 디렉토리include/: 헤더 파일을 저장하는 디렉토리lib/: 외부 라이브러리 파일을 저장하는 디렉토리bin/: 컴파일된 실행 파일을 저장하는 디렉토리build/: 빌드 시스템이 생성한 파일을 저장하는 디렉토리test/: 테스트 코드를 저장하는 디렉토리docs/: 프로젝트 문서를 저장하는 디렉토리CMakeLists.txt: CMake 빌드 스크립트 파일README.md: 프로젝트에 대한 기본 정보를 제공하는 파일LICENSE: 라이선스 정보 파일디렉토리 구조 예시project/│├── src/│.. 2024. 6. 8.
[PyTorch] 주요 개념 PyTorch는 페이스북의 AI 연구팀에서 개발한 오픈 소스 딥러닝 프레임워크로, 특히 연구와 개발 환경에서 많이 사용됩니다. PyTorch는 텐서 계산 및 동적 계산 그래프를 기반으로 하며, 이를 통해 복잡한 모델을 쉽게 설계하고 디버깅할 수 있습니다. PyTorch의 핵심 개념과 기능을 소개하겠습니다.1. 텐서(Tensor)텐서는 PyTorch의 기본 데이터 구조입니다. 텐서는 N차원의 배열로, 수학적 연산을 수행하는 데 사용됩니다.텐서는 torch.Tensor 클래스를 사용하여 생성할 수 있습니다. 예를 들어, 2x3 행렬을 생성하려면 다음과 같습니다.import torchx = torch.Tensor([[1, 2, 3], [4, 5, 6]])2. 자동 미분(Autograd)Autograd는 PyT.. 2024. 6. 8.
[CV] U-Net [출처]: U-Net: Convolutional Networks for Biomedical Image Segmentation U-Net: 생의학 이미지 분할을 위한 컨볼루션 네트워크저자:Olaf Ronneberger, Philipp Fischer, Thomas Brox독일 프라이부르크 대학교요약:이 논문은 생의학 이미지 분할을 위한 컨볼루션 네트워크 구조와 훈련 전략을 소개합니다. 주요 특징은 다음과 같습니다:주석이 달린 샘플을 효율적으로 사용하기 위한 데이터 증강.맥락을 포착하는 수축 경로와 정밀한 위치 지정이 가능한 확장 경로를 가진 대칭 아키텍처.몇 개의 이미지로부터 엔드 투 엔드로 훈련 가능, 이전 방법보다 뛰어난 성능.빠른 분할 능력 (최근 GPU에서 512x512 이미지 분할이 1초 이내).구.. 2024. 6. 7.
[RecSys] 학습 로드맵 1. 기초 논문1.1. 협업 필터링"Item-based Collaborative Filtering Recommendation Algorithms" - Badrul Sarwar, George Karypis, Joseph Konstan, John Riedl (2001)협업 필터링의 기본 개념과 아이템 기반 추천 알고리즘에 대한 논문입니다.링크"Empirical Analysis of Predictive Algorithms for Collaborative Filtering" - John S. Breese, David Heckerman, Carl Kadie (1998)협업 필터링 예측 알고리즘의 실증 분석에 관한 논문입니다.링크1.2. 콘텐츠 기반 필터링"Content-based recommendation sys.. 2024. 6. 7.
[CV] CvT [출처] CvT: Introducing Convolutions to Vision Transformers [출처]: An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale 요약논문 제목: An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale저자: Alexey Dosovitskiy, Lucas Beyer, Alexander Kolesnikov, Dirk Weissenborn, Xiaohua Zhai, Thomas Unterthiner, Mostafa Dehghani, Matthias Minderer, Georg Heigold, Sylvain Gelly.. 2024. 6. 7.
[CV] Deformable Convolutional Networks [출처]: Deformable Convolutional Networks  "Deformable Convolutional Networks" 요약저자: Jifeng Dai, Haozhi Qi, Yuwen Xiong, Yi Li, Guodong Zhang, Han Hu, Yichen Wei소속: Microsoft Research Asia요약: 컨볼루션 신경망(CNN)은 고정된 기하 구조로 인해 기하 변환을 모델링하는 데 어려움을 겪습니다. 이를 해결하기 위해 저자들은 변형 가능 컨볼루션(deformable convolution)과 변형 가능 RoI 풀링(deformable RoI pooling)을 도입했습니다. 이 모듈들은 추가적인 감독 없이 대상 작업에서 학습된 오프셋을 기반으로 공간 샘플링 위치를 조정하여.. 2024. 6. 7.
[CV] YOLO v2 [출처]: YOLO9000: Better, Faster, StrongerYOLO9000은 실시간으로 9000개 이상의 객체를 인식할 수 있는 최첨단 객체 검출 시스템입니다. 주요 특징과 개선 사항은 다음과 같습니다:YOLOv2 개선 사항:배치 정규화: 수렴 속도를 높이고 과적합을 방지.고해상도 분류기: 더 높은 해상도의 입력 이미지를 사용하여 정확도 향상.앵커 박스 사용: 앵커 박스를 사용하여 예측을 단순화하고 재현율을 높임.차원 클러스터링: K-평균 클러스터링을 사용하여 더 나은 앵커 박스 초기값 설정.직접 위치 예측: 예측 안정성을 높임.세분화된 특징 사용: 작은 객체의 위치를 더 정확하게 잡아냄.멀티스케일 학습: 다양한 해상도에서 예측을 잘할 수 있도록 함.성능:PASCAL VOC와 COCO와 같은.. 2024. 6. 7.
[CV] YOLO [출처]: You Only Look Once: Unified, Real-Time Object Detection 제공된 문서는 객체 탐지를 위한 새로운 접근법인 YOLO(You Only Look Once)에 대해 설명합니다. 주요 요점을 요약하면 다음과 같습니다:개요:YOLO는 객체 탐지를 단일 회귀 문제로 재정의하여, 단일 신경망을 통해 전체 이미지에서 한 번의 평가로 바운딩 박스와 클래스 확률을 직접 예측합니다.이 통합 아키텍처는 전체 탐지 파이프라인을 탐지 성능에 맞게 끝에서 끝으로 최적화할 수 있게 합니다.성능:YOLO는 매우 빠르며, 기본 모델로 초당 45 프레임(fps), Fast YOLO 버전으로는 초당 155 프레임을 실시간으로 처리할 수 있습니다.YOLO는 최첨단 시스템에 비해 위치 오류가.. 2024. 6. 7.
[CV] Cascade R-CNN [출처]: Cascade R-CNN: Delving into High Quality Object Detection 요약:논문 "Cascade R-CNN: Delving into High Quality Object Detection"은 객체 검출 성능을 향상시키기 위한 새로운 접근 방식을 소개합니다.요약:Cascade R-CNN은 훈련 중 과적합 문제와 추론 중 품질 불일치 문제를 해결하기 위해 고안된 다단계 객체 검출 프레임워크입니다. 낮은 교차 비율(IoU) 임계값으로 훈련된 전통적인 객체 검출기는 종종 잡음이 많은 검출 결과를 만듭니다. 훈련 중에 IoU 임계값을 높이는 것은 양성 샘플의 감소와 검출기의 최적 IoU와 입력 가설 간의 불일치로 인해 성능 저하를 초래할 수 있습니다.주요 기여:다단계 아.. 2024. 6. 7.
[CV] EfficientDet [출처]: EfficientDet: Scalable and Efficient Object Detection "EfficientDet: Scalable and Efficient Object Detection" 요약이 논문은 효율성과 확장성을 염두에 두고 설계된 새로운 객체 탐지기 모델 군인 EfficientDet을 소개합니다. 주요 기여는 다음과 같습니다:BiFPN (양방향 피라미드 네트워크): EfficientDet은 효율적이고 빠른 다중 스케일 특징 융합을 가능하게 하는 가중 양방향 피라미드 네트워크(BiFPN)를 도입합니다. BiFPN은 학습 가능한 가중치를 사용하여 다양한 입력 특징의 중요도를 결정하여 융합 과정을 향상시킵니다.복합 스케일링 방법: 이 논문은 백본, 특징 네트워크, 박스/클래스 예측.. 2024. 6. 7.
반응형