본문 바로가기
728x90
[CV] Grad-CAM++ [출처]: Grad-CAM++: Improved Visual Explanations for Deep Convolutional Networks논문 요약: Grad-CAM++: Improved Visual Explanations for Deep Convolutional Networks개요Grad-CAM++는 기존 Grad-CAM 기법을 확장하여 CNN 모델의 예측에 대한 시각적 설명을 제공하는 방법입니다. 이 논문은 Grad-CAM++가 객체의 위치를 더 잘 파악하고 하나의 이미지에 여러 객체 인스턴스가 있을 때 더 나은 설명을 제공한다고 주장합니다.주요 기여픽셀 단위 가중치: Grad-CAM++는 CNN의 마지막 합성곱 층의 피쳐 맵에서 각 픽셀의 중요성을 평가하여 시각적 설명을 생성합니다. 이를 위해 고.. 2024. 6. 7.
[CV] CAM [출처]: Learning Deep Features for Discriminative Localization 논문 "학습된 깊은 특징들을 통한 판별적 지역화"는 Bolei Zhou, Aditya Khosla, Agata Lapedriza, Aude Oliva, Antonio Torralba가 작성한 것으로, 이미지 수준의 레이블로 학습된 CNN(Convolutional Neural Network)이 전역 평균 풀링(GAP, Global Average Pooling)을 사용하여 놀라운 지역화 능력을 가지도록 하는 방법을 탐구합니다. 다음은 논문의 요약입니다:초록저자들은 전역 평균 풀링(GAP) 레이어를 재검토하고, 이것이 이미지 수준의 레이블로 학습되었음에도 불구하고 CNN이 놀라운 지역화 능력을 가지도록.. 2024. 6. 7.
[CV] DenseNet [출처]: Densely Connected Convolutional Networks  요약: Densely Connected Convolutional Networks (DenseNet)개요DenseNet은 모든 레이어를 피드포워드 방식으로 서로 연결하여 정보 흐름을 최적화하는 네트워크 아키텍처입니다. 전통적인 컨볼루션 네트워크는 각 레이어 간 하나의 연결을 가지지만, DenseNet은 L(L+1)/2개의 직접 연결을 가집니다. 이러한 구조는 정보 손실을 줄이고, 특징 재사용을 촉진하며, 파라미터 수를 크게 줄이는 등의 장점이 있습니다. DenseNet은 CIFAR-10, CIFAR-100, SVHN, ImageNet과 같은 객체 인식 벤치마크에서 탁월한 성능을 보였습니다​​ .소개컨볼루션 신경망(CNN).. 2024. 6. 7.
[CV] ResNet [출처]: Deep Residual Learning for Image Recognition "Deep Residual Learning for Image Recognition" 요약저자: Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun (Microsoft Research)초록:깊은 신경망의 훈련 어려움을 해결합니다.층 입력을 참조하여 잔여 함수를 학습하도록 층을 재구성하는 잔여 학습 프레임워크를 소개합니다.잔여 네트워크(ResNets)가 최적화하기 더 쉽고 깊이가 증가함에 따라 정확도가 높아짐을 입증합니다.ImageNet 데이터셋에서 최대 152층의 잔여 네트워크를 평가하여 3.57%의 오류율로 최첨단 성능을 달성했습니다.COCO 객체 탐지 데이터셋에서도 깊은 표현.. 2024. 6. 7.
[CV] VggNet [출처]: Very Deep Convolutional Networks for Large-Scale Image Recognition논문 요약: Very Deep Convolutional Networks for Large-Scale Image Recognition논문 제목: Very Deep Convolutional Networks for Large-Scale Image Recognition저자: Karen Simonyan, Andrew Zisserman발표된 학회: ICLR 2015요약이 논문은 대규모 이미지 인식을 위해 매우 깊은 컨볼루션 신경망(ConvNets)의 효과를 조사합니다. 저자들은 16~19개의 가중치 레이어를 가진 네트워크를 평가하여 네트워크 깊이가 정확도에 미치는 영향을 분석하였습니다. .. 2024. 6. 7.
[CV] GoogleNet [출처]: Going Deeper with Convolutions"Going Deeper with Convolutions" 요약저자: Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, Andrew Rabinovich초록: 이 논문은 Inception이라는 깊은 컨볼루션 신경망 아키텍처를 소개하며, 이는 2014년 ImageNet 대규모 시각 인식 챌린지(ILSVRC14)에서 분류 및 검출 작업에서 최신 상태를 설정하는 데 기여했습니다. 특히 GoogLeNet이라는 변형은 네트워크의 깊이와 너비를 늘리면서도 일정한 계산 예산을 유지하도록.. 2024. 6. 7.
[CV] AlexNet [출처]: ImageNet Classification with Deep Convolutional Neural Networks 주요 내용 요약: AlexNet 논문 (ImageNet Classification with Deep Convolutional Neural Networks)저자: Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton1. 개요AlexNet은 ImageNet LSVRC-2010 콘테스트의 1.2백만 개의 고해상도 이미지를 1000개의 클래스에 분류하기 위해 개발된 대형 심층 합성곱 신경망(CNN)입니다.테스트 데이터에서 top-1 오류율 37.5%, top-5 오류율 17.0%를 달성했으며, 이는 이전 최첨단 기술보다 훨씬 우수한 성능입니다.이 신.. 2024. 6. 7.
[CV] LeNet-5 [출처]: GradientBased Learning Applied to Document Recognition LeNet-5 논문은 Yann LeCun 등 여러 연구자가 1998년에 발표한 논문으로, 손글씨 숫자 인식을 위한 합성곱 신경망(Convolutional Neural Network, CNN)의 아키텍처를 제안합니다. 이 논문은 합성곱 신경망을 통해 이미지 인식 문제를 해결하는 방법을 제시하며, LeNet-5는 특히 손글씨 숫자 인식에서 큰 성과를 보였습니다.주요 내용 요약배경 및 목적: 전통적인 패턴 인식 기법은 주로 특징 추출과 분류 단계를 분리하여 수행했습니다. 하지만 LeCun 등은 자동으로 특징을 학습하고 분류하는 신경망을 제안했습니다.LeNet-5 아키텍처:입력층: 32x32 픽셀의 이미.. 2024. 6. 7.
반응형