반응형 [CV] RetinaNet [출처]: Focal Loss for Dense Object DetectionRetinaNet 요약저자: Tsung-Yi Lin, Priya Goyal, Ross Girshick, Kaiming He, Piotr Dollar소속: Facebook AI Research (FAIR)초록이 논문은 COCO 벤치마크에서 최첨단 정확도를 달성하는 1단계 객체 탐지기인 RetinaNet을 소개합니다. 주요 혁신은 Focal Loss로, 이는 훈련 중에 발생하는 극단적인 전경-배경 클래스 불균형 문제를 해결하기 위해 설계되었습니다.소개현재 최첨단 객체 탐지기는 2단계 접근 방식(예: R-CNN)에 의존합니다. 1단계 탐지기는 더 빠르고 단순하지만 정확도에서 뒤처져 왔습니다. 이 논문은 클래스 불균형을 주요 문제로 식.. 2024. 6. 7. [CV] Faster R-CNN [출처]: Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks "Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks" 문서는 Region Proposal Networks (RPN)와 Fast R-CNN을 통합한 고급 객체 탐지 프레임워크를 소개합니다. 주요 내용을 요약하면 다음과 같습니다:초록 (Abstract):최신 객체 탐지 네트워크는 객체 위치를 가정하기 위해 영역 제안 알고리즘을 사용합니다.Faster R-CNN은 탐지 네트워크와 컨볼루션 특징을 공유하는 Region Proposal Network (RPN)를 도입하여 영.. 2024. 6. 7. [MMEngine] 개요 MMEngine - Pytorch를 기반으로 하는 deep learning models을 학습하기 위한 라이브러리 - Linux, Windows와 macOS를 지원함 MMEngine의 3가지 특징 1. 범용적이고 강력한 executor - 최소한의 코드로 복잡한 task 학습 가능 - timm, torchvision, detectorn2와 호환 가능 2. 통합된 인터페이스의 공개된 구조 - 통합된 API로 다른 작업에 적용 가능 - 높은 레벨의 추상화를 통해 다양한 장비를 지원(Nvidia CUDA, Mac MPS, AMD, MLU) 3. 학습 과정 Custmize 가능 - 레고 같이 모듈화된 training engine - 다양한 component 제공 - 다양한 level의 API들로 학습 과정 제어.. 2024. 1. 14. [MMDetection] 개요 MMDetection - MMDetection은 객체 탐지를 위한 toolbox로 객체 탐지, 인스턴스 세그멘테이션 그리고 판옵틱 세그멘테이션 등을 포함한 구성요소나 모듈을 포함함. - 7개의 부분으로 구성: apis, structures, datasets, models, engine, evaluation, visualization. - github: https://github.com/open-mmlab/mmdetection 구성요소 - apis: 모델 추론에 사용되는 고수준 API제공 - datasets: 객체 탐지, 세그멘테이션을 지원하는 다양하 데이터셋 - transforms: 데이터 증강에 필요한 툴을 포함 - samplers: strategy별 다양한 데이터로더 - models: detector.. 2024. 1. 13. 이전 1 다음 반응형