[Segmentation] Semantic Segmentation 알아보기 FCN, U-Net
·
Computer Vision1/Computer Vision
이번 포스팅에서는 시멘틱 세그멘테이션(Semantic Segmentation) 에 대해 다뤄보았다 시멘틱 세그멘테이션이란?Segmentation → 분할, 나누기Semantic → 의미론적인우리는 컴퓨터 비전을 배웠기 때문에 Image Segmentation 방법론에 대해 들어봤을 것이다. 의미와 상관없이 비슷한 색, 밝기, 질감 등을 기준으로 영역을 나누는 방법론 등이 있었는데 정리해보자면 Thresholding, Edge Detection / Watershed, Clustering기법, Graph-based Segmentation등이 있었다. 더 나아가서는 Selective Search같은 방법도 배웠다. 오늘 알아볼 Semantic Segmentation은 단순히 색상이나 질감이 아니라, “이 ..
[Deep Learning] Partial Fine-Tuning 해보기
·
Computer Vision1/Project
Feature Extractor만 활용해보는 ResNet50 전이학습 딥러닝 모델을 학습할 때, 모델 전체를 처음부터 학습(From Scratch) 하는 것은 시간도 오래 걸리고, 많은 데이터가 필요하다.그래서 우리는 보통 전이학습(Transfer Learning) 을 이용한다. 그중에서도 이번 글에서는 Partial Fine-Tuning, 즉 Feature Extractor만 사용하는 전이학습을 직접 실험해본다. Fine-Tuning의 세 가지 방식먼저 개념을 간단히 정리해보자.From Scratch랜덤 초기화로 처음부터 학습Full Fine-TuningImageNet 등 사전학습 가중치로 초기화 후 전체 재학습Partial Fine-Tuning (Feature Extractor)사전학습된 백본을 고정..
[Object Detection] One-Stage Object Detection - YOLO, SSD, RetinaNet
·
Computer Vision1/Paper reviews
One-Stage Object Detection 개요 우리는 이전까지 Two-Stage Object Detection을 리뷰하였고 이번에는 Region Proposal 과정을 생략하고 Bounding Box Regression + Classification 동시에 수행하는 One-Stage Detector를 살펴보겠다. YOLO YOLO = You Only Look Once.Region Proposal을 생략하고 한 번의 Forward Pass로 Detection 수행.YOLOv1 → v2 → v3 → … → v5, v8, v10까지 지속 개발 되어 요즘도 널리 쓰이는 대표적인 One-Stage Detector이다. 우선 YOLO는 입력 이미지를 S×S Grid로 나눔. (YOLO v1에서는 7×7)..
[Generative AI] Flow Matching for Generative Modeling
·
Computer Vision1/Paper reviews
이 리뷰는 오직 학습과 참고 목적으로 작성되었으며, 해당 논문을 통해 얻은 통찰력과 지식을 공유하고자 하는 의도에서 작성된 것입니다. 본 리뷰를 통해 수익을 창출하는 것이 아니라, 제 학습과 연구를 위한 공부의 일환으로 작성되었음을 미리 알려드립니다. 이 논문은 Continuous Normalizing Flows(CNF)를 시뮬레이션 없이 효율적으로 학습할 수 있는 방법으로 Flow Matching(FM)을 제안한다. 최근 생성 모델에서 Flow Matching 관심을 끌고 있는 만큼, 논문을 리뷰해 보게 되었다. https://arxiv.org/abs/2210.02747 Flow Matching for Generative ModelingWe introduce a new paradigm for gener..
[ILSVRC 논문 정리해 보기] DenseNet, SENet과 대회 그 이후
·
Computer Vision1/Paper reviews
2025.09.05 - [분류 전체보기] - [ILSVRC 논문 정리해 보기] VGGNet, GoogleNet, ResNet [ILSVRC 논문 정리해 보기] VGGNet, GoogleNet, ResNet이전 논문 리뷰에 이어서 ILSVRC논문을 정리해보았다.2025.05.07 - [Computer Vision1/Paper reviews] - [ILSVRC 논문 정리해 보기] AlexNet (ImageNet Classification with Deep Convolutional Neural Networks) [ILSVRC 논문 정리해 보기]c0mputermaster.tistory.com DenseNet ResNet의 Residual Block에서는 y=F(x)+x를 하였다면 DenseNet에 DenseBl..
[ILSVRC 논문 정리해 보기] VGGNet, GoogleNet, ResNet
·
Computer Vision1/Paper reviews
이전 논문 리뷰에 이어서 ILSVRC논문을 정리해보았다.2025.05.07 - [Computer Vision1/Paper reviews] - [ILSVRC 논문 정리해 보기] AlexNet (ImageNet Classification with Deep Convolutional Neural Networks) [ILSVRC 논문 정리해 보기] AlexNet (ImageNet Classification with Deep Convolutional Neural Networks)ILSVRC(ImageNet Large-Scale Visual Recognition Challenge)이란?- 2010년 ~ 2017년 매년 개최된 국제 컴퓨터 비전 경진대회로 대규모 데이터셋(ImageNet)을 기반으로 이미지 인식 성능을..
[Project] Classification Model 구현해보기 (ResNet)
·
Computer Vision1/Project
Classification 모델을 구현해보자 먼저 Train과 Test 구조를 정의 Importimport torchimport torch.nn as nnimport torch.nn.functional as Fimport torchvisionimport torchvision.transforms as transformsimport torch.optim as optimimport osimport matplotlib.pyplot as plt torch.nn as nn 신경망 레이어와 모델 구축을 위한 모듈.예: nn.Conv2d, nn.Linear, nn.BatchNorm2d 등을 사용해 레이어 정의. torch.nn.functional as F 활성화 함수나 pooling 같은 연산을 함수형(functi..
[Anomaly Detection] Industrial Image Anomaly Detection: Survey
·
Computer Vision1/Computer Vision
이 리뷰는 오직 학습과 참고 목적으로 작성되었으며, 해당 논문을 통해 얻은 통찰력과 지식을 공유하고자 하는 의도에서 작성된 것입니다. 본 리뷰를 통해 수익을 창출하는 것이 아니라, 제 학습과 연구를 위한 공부의 일환으로 작성되었음을 미리 알려드립니다. 오늘은 산업 이미지 이상치 탐지의 트렌드와 실제 사용되는 모습을 파악하고 싶어서 다음 논문과 세미나 영상을 통해 정리하여 보았다.https://arxiv.org/abs/2301.11514 Deep Industrial Image Anomaly Detection: A SurveyThe recent rapid development of deep learning has laid a milestone in industrial Image Anomaly Detectio..
[Object Detection] Faster R-CNN
·
Computer Vision1/Paper reviews
이번에는 Selective Search 시간이 너무 오래 걸리는 Fast RCNN을 NN으로 바꿔서 속도를 줄여보자는 아이디어에서 나온 Faster R-CNN에 대해 리뷰하여 볼것이다. 2025.07.17 - [분류 전체보기] - [Object Detection] SPPNet과 Fast R-CNN [Object Detection] SPPNet과 Fast R-CNN오늘은 Two-Stage Object Detection 모델중 저번 R-CNN에 이어서 SPPNet과 Fast RCNN에 대해 알아보려고 한다.2025.07.10 - [Computer Vision1/Paper reviews] - [Object Detection] Two-Stage Object Detection – R-CNN (Rich featur..
[Object Detection] SPPNet과 Fast R-CNN
·
Computer Vision1/Paper reviews
오늘은 Two-Stage Object Detection 모델중 저번 R-CNN에 이어서 SPPNet과 Fast RCNN에 대해 알아보려고 한다.2025.07.10 - [Computer Vision1/Paper reviews] - [Object Detection] Two-Stage Object Detection – R-CNN (Rich feature hierarchies for accurate object detection and semantic segmentation) [Object Detection] Two-Stage Object Detection – R-CNNTwo-Stage Object Detection 논문들을 하나씩 살펴볼건데 오늘은 R-CNN논문을 다루어 보려고 한다논문 링크 : https:/..
[Object Detection] Two-Stage Object Detection – R-CNN
·
Computer Vision1/Paper reviews
Two-Stage Object Detection 논문들을 하나씩 살펴볼건데 오늘은 R-CNN논문을 다루어 보려고 한다논문 링크 : https://arxiv.org/pdf/1311.2524 Recap) 먼저 Two-Stage Object Detection이란?2024.12.27 - [Computer Vision1/Computer Vision] - [Object Detection] 1-Stage vs. 2-Stage Object Detection 아키텍처 비교 [Object Detection] 1-Stage vs. 2-Stage Object Detection 아키텍처 비교Object Detection detector 객체 탐지(Object Detection) 시스템에서 이미지나 비디오 내의 객체를 식별하고..
[ILSVRC 논문 정리해 보기] AlexNet (ImageNet Classification with Deep Convolutional Neural Networks)
·
Computer Vision1/Paper reviews
ILSVRC(ImageNet Large-Scale Visual Recognition Challenge)이란?- 2010년 ~ 2017년 매년 개최된 국제 컴퓨터 비전 경진대회로 대규모 데이터셋(ImageNet)을 기반으로 이미지 인식 성능을 겨루었던 역사적인 대회- 2012년부터 AlexNet의 등장으로 Deep learning의 시대를 열었음- 컨볼루셔널 뉴럴 네트워크(CNN) 구조들이 도출된 역사적인 대회 참고하자면 이미지넷 데이터셋의 규모는 학습용 이미지: 120만 장카테고리(class): 1,000개 이상성능 검증용 데이터셋: 총 15만 개 (val 5만 + test 10만장)AlexNet ILSVRC 2012년 대회 우승작 AlexNet 이전 인공지능 기법들은 정확도를 기껏해야 1% 정도 향상시..