생성 모델 정리하기 (MLE · VAE · GAN · Diffusion · Language Model)
·
카테고리 없음
1. 생성(Generation) vs 판별(Discrimination) & 왜 VAE가 중요한가생성(Generation): 데이터 분포 자체를 배워서, 거기서 새 샘플을 뽑아내는 모델을 만드는 것.판별(Discrimination): 주어진 입력 x에 대해 라벨/클래스 y를 맞히는 문제 (분류, 검출, 세그멘테이션 등).Variational Autoencoder(VAE), 즉 Variational 방법론VAE를 이해하고, 그 안에 들어있는 최대우도추정(MLE, Maximum Likelihood Estimation),변분추론(Variational Inference), KL Divergence, ELBO, Reparameterization Trick을 이해하는 것이생성·확률·베이즈·디퓨전 등으로 넘어가는 핵심..
[Object Tracking] Visual Object Tracking (VOT) 알아보기 (Distance Learning)
·
카테고리 없음
이번 포스팅에서는 Visual Object Tracking (VOT)에 대해 다뤄보았다 Visual Object Tracking (VOT)Visual Object Tracking (VOT)은 비디오 상에서 특정 객체(Target Object)의 움직임을 지속적으로 추적하는 기술이다.즉, 비디오의 각 프레임에서 목표 객체의 위치를 지속적으로 예측하고, 시간의 흐름에 따라 그 궤적을 추적한다. Single Object Tracking (SOT) : 하나의 객체를 추적Multi Object Tracking (MOT) : 여러 객체를 동시에 추적이번 포스팅에서는 Single Object Tracking을 중심으로 다룬다. 2. Object Detection vs Object Tracking Object De..
[Segmentation] DeepLab, Mask R-CNN, PanopticFPN
·
카테고리 없음
이번 포스팅에서는 시멘틱 세그멘테이션(Semantic Segmentation) 에 대해 저번 포스팅에 이어서, 보다 세밀한 픽셀 단위의 인식 과정을 이해하기 위해 Dilated Convolution(또는 Atrous Convolution) 과 이를 기반으로 한 대표 모델인 DeepLab 시리즈를 살펴보고, 이어지는 Mask R-CNN 과 Panoptic FPN 으로 확장되는 세그멘테이션 계열 모델들을 함께 알아보겠다. Recap) 시멘틱 세그멘테이션(Semantic Segmentation)의 개념 시멘틱 세그멘테이션이란 영상의 각 픽셀이 어떤 클래스(의미)에 속하는지를 구분하는 문제이다. 즉, 입력 이미지의 모든 픽셀마다 “이 픽셀이 하늘인가? 도로인가? 사람인가?”를 예측하는 과정이다. 이를 수행하..
[Segmentation] Semantic Segmentation 알아보기 FCN, U-Net
·
Computer Vision1/Computer Vision
이번 포스팅에서는 시멘틱 세그멘테이션(Semantic Segmentation) 에 대해 다뤄보았다 시멘틱 세그멘테이션이란?Segmentation → 분할, 나누기Semantic → 의미론적인우리는 컴퓨터 비전을 배웠기 때문에 Image Segmentation 방법론에 대해 들어봤을 것이다. 의미와 상관없이 비슷한 색, 밝기, 질감 등을 기준으로 영역을 나누는 방법론 등이 있었는데 정리해보자면 Thresholding, Edge Detection / Watershed, Clustering기법, Graph-based Segmentation등이 있었다. 더 나아가서는 Selective Search같은 방법도 배웠다. 오늘 알아볼 Semantic Segmentation은 단순히 색상이나 질감이 아니라, “이 ..
[Deep Learning] Partial Fine-Tuning 해보기
·
Computer Vision1/Project
Feature Extractor만 활용해보는 ResNet50 전이학습 딥러닝 모델을 학습할 때, 모델 전체를 처음부터 학습(From Scratch) 하는 것은 시간도 오래 걸리고, 많은 데이터가 필요하다.그래서 우리는 보통 전이학습(Transfer Learning) 을 이용한다. 그중에서도 이번 글에서는 Partial Fine-Tuning, 즉 Feature Extractor만 사용하는 전이학습을 직접 실험해본다. Fine-Tuning의 세 가지 방식먼저 개념을 간단히 정리해보자.From Scratch랜덤 초기화로 처음부터 학습Full Fine-TuningImageNet 등 사전학습 가중치로 초기화 후 전체 재학습Partial Fine-Tuning (Feature Extractor)사전학습된 백본을 고정..
[Object Detection] One-Stage Object Detection - YOLO, SSD, RetinaNet
·
Computer Vision1/Paper reviews
One-Stage Object Detection 개요 우리는 이전까지 Two-Stage Object Detection을 리뷰하였고 이번에는 Region Proposal 과정을 생략하고 Bounding Box Regression + Classification 동시에 수행하는 One-Stage Detector를 살펴보겠다. YOLO YOLO = You Only Look Once.Region Proposal을 생략하고 한 번의 Forward Pass로 Detection 수행.YOLOv1 → v2 → v3 → … → v5, v8, v10까지 지속 개발 되어 요즘도 널리 쓰이는 대표적인 One-Stage Detector이다. 우선 YOLO는 입력 이미지를 S×S Grid로 나눔. (YOLO v1에서는 7×7)..
[Generative AI] Flow Matching for Generative Modeling
·
Computer Vision1/Paper reviews
이 리뷰는 오직 학습과 참고 목적으로 작성되었으며, 해당 논문을 통해 얻은 통찰력과 지식을 공유하고자 하는 의도에서 작성된 것입니다. 본 리뷰를 통해 수익을 창출하는 것이 아니라, 제 학습과 연구를 위한 공부의 일환으로 작성되었음을 미리 알려드립니다. 이 논문은 Continuous Normalizing Flows(CNF)를 시뮬레이션 없이 효율적으로 학습할 수 있는 방법으로 Flow Matching(FM)을 제안한다. 최근 생성 모델에서 Flow Matching 관심을 끌고 있는 만큼, 논문을 리뷰해 보게 되었다. https://arxiv.org/abs/2210.02747 Flow Matching for Generative ModelingWe introduce a new paradigm for gener..
[ILSVRC 논문 정리해 보기] DenseNet, SENet과 대회 그 이후
·
Computer Vision1/Paper reviews
2025.09.05 - [분류 전체보기] - [ILSVRC 논문 정리해 보기] VGGNet, GoogleNet, ResNet [ILSVRC 논문 정리해 보기] VGGNet, GoogleNet, ResNet이전 논문 리뷰에 이어서 ILSVRC논문을 정리해보았다.2025.05.07 - [Computer Vision1/Paper reviews] - [ILSVRC 논문 정리해 보기] AlexNet (ImageNet Classification with Deep Convolutional Neural Networks) [ILSVRC 논문 정리해 보기]c0mputermaster.tistory.com DenseNet ResNet의 Residual Block에서는 y=F(x)+x를 하였다면 DenseNet에 DenseBl..
[ILSVRC 논문 정리해 보기] VGGNet, GoogleNet, ResNet
·
Computer Vision1/Paper reviews
이전 논문 리뷰에 이어서 ILSVRC논문을 정리해보았다.2025.05.07 - [Computer Vision1/Paper reviews] - [ILSVRC 논문 정리해 보기] AlexNet (ImageNet Classification with Deep Convolutional Neural Networks) [ILSVRC 논문 정리해 보기] AlexNet (ImageNet Classification with Deep Convolutional Neural Networks)ILSVRC(ImageNet Large-Scale Visual Recognition Challenge)이란?- 2010년 ~ 2017년 매년 개최된 국제 컴퓨터 비전 경진대회로 대규모 데이터셋(ImageNet)을 기반으로 이미지 인식 성능을..
[Project] Classification Model 구현해보기 (ResNet)
·
Computer Vision1/Project
Classification 모델을 구현해보자 먼저 Train과 Test 구조를 정의 Importimport torchimport torch.nn as nnimport torch.nn.functional as Fimport torchvisionimport torchvision.transforms as transformsimport torch.optim as optimimport osimport matplotlib.pyplot as plt torch.nn as nn 신경망 레이어와 모델 구축을 위한 모듈.예: nn.Conv2d, nn.Linear, nn.BatchNorm2d 등을 사용해 레이어 정의. torch.nn.functional as F 활성화 함수나 pooling 같은 연산을 함수형(functi..
[Anomaly Detection] Industrial Image Anomaly Detection: Survey
·
Computer Vision1/Computer Vision
이 리뷰는 오직 학습과 참고 목적으로 작성되었으며, 해당 논문을 통해 얻은 통찰력과 지식을 공유하고자 하는 의도에서 작성된 것입니다. 본 리뷰를 통해 수익을 창출하는 것이 아니라, 제 학습과 연구를 위한 공부의 일환으로 작성되었음을 미리 알려드립니다. 오늘은 산업 이미지 이상치 탐지의 트렌드와 실제 사용되는 모습을 파악하고 싶어서 다음 논문과 세미나 영상을 통해 정리하여 보았다.https://arxiv.org/abs/2301.11514 Deep Industrial Image Anomaly Detection: A SurveyThe recent rapid development of deep learning has laid a milestone in industrial Image Anomaly Detectio..
[Object Detection] Faster R-CNN
·
Computer Vision1/Paper reviews
이번에는 Selective Search 시간이 너무 오래 걸리는 Fast RCNN을 NN으로 바꿔서 속도를 줄여보자는 아이디어에서 나온 Faster R-CNN에 대해 리뷰하여 볼것이다. 2025.07.17 - [분류 전체보기] - [Object Detection] SPPNet과 Fast R-CNN [Object Detection] SPPNet과 Fast R-CNN오늘은 Two-Stage Object Detection 모델중 저번 R-CNN에 이어서 SPPNet과 Fast RCNN에 대해 알아보려고 한다.2025.07.10 - [Computer Vision1/Paper reviews] - [Object Detection] Two-Stage Object Detection – R-CNN (Rich featur..