[CV 기초] #1 컴퓨터 비전

2024. 3. 26. 23:16·Computer Vision1/Basic

컴퓨터 비전

 

컴퓨터 비전이란?

  • 이미지에 대한 설명으로 이미지를 만드는 것이 컴퓨터 그래픽
  • 컴퓨터 비전은 이미지에서 이미지에 대한 설명을 만드는 것이 컴퓨터 비전
  • 이미지에서 명확하고 의미있는 설명과 특징, 관계, 문맥을 찾아내는 것
  • 2차원 이미지를 가지고 3차원 세계를 설명해야함, 해석이 다양해진다 ( inverse problem )

 

컴퓨터 비전의 성장 배경

  • 데이터가 엄청 많아짐
  • 관련 분야들의 성장이 빠름
  • 많은 생물학적 시스템들이 시각에 의존적이라 시각 데이터가 중요
  • 알고리즘들이 늘어나고, 카메라 기술이 발전됨

 

컴퓨터 비전의 목표

  • 사람의 시각에 맞먹는 인공 시각을 만든다 ( 제약이 있는 상황 )
  • 한정된 범위에서 특정한 임무를 달성하는 인공 시각을 만든다 ( 제약이 없는 상황 )

 

컴퓨터 비전과 영상처리

영상처리

  • 원래의 영상을 새로운 영상으로 변환
  • 컴퓨터 비전의 전처리 과정

 

사람의 눈과 카메라

  • 수정체는 렌즈, 망막은 CCD 센서 (필름)에 해당
  • CCD : 빛을 전기적 신호로 바꿔주는 광 센서 반도체
  • 빛은 CCD에 붙어있는 RGB 색 필터에 의해 각기 다른 색으로 분리된 후 ADC라는 변환장치를 통해 디지털 신호로 변환

 

컴퓨터 비전 기초

샘플링과 양자화

  • 2차원 영상 공간을 M*N개의 점으로 샘플링
  • 화소의 명암을 L단계로 양자화 ( L은 명암 단계라고 부름 0~1-L )
  • 예시 ) M = 12, N = 12, L = 10 인 경우 L은 0~10

세로 M / 가로 N

예시) 3*4 영상 L = 10

텐서 = 다차원 이미지

  • 2차원 텐서 : 명암 영상
  • 3차원 텐서 : rgb 영상
  • 4차원 텐서 : rgb 영상의 집함 like 동영상
  • 다분광/ 초분광/mr/ct : 가시광선 rgb외에 적외선 x선 감마선 등등 보이지 않는 파장의 빛을 탐지 = 멀티 스팩트럼, 하이터 스팩트럼이라고 부름 ( 다분광, 초분광)
  • RGB - D : 댑스나 레인지( 강도, 세기 ) 등등을 표현
  • 점구름 : 라이더, 물체와의 거리를 획득

 

RGB모델

  • 가시광선
  • (고주파)파장이 짧은 → (저주파)파장이 긴 
    • 주파수 = 1 / 파장
    • 우세 주파수의 색 = 물체의 색상
    • 우세 파장 - 흡수된 파장 = 채도
    • 빛의 세기 = 명도 EW
    • 영상을 스무딩을 하여라 => 독립적으로 분할하여 처리하고 다시 합쳐야함

컬러 표현 변환

  • CIE Lab ( 인지 컬러 모델 )
    • RGB를 사용시 두 컬러 간의 유사도 층적으로 좋지 않음
    • 동일한 거리라도 서로 다른 컬러인 경우가 있음
  • RGB 모델을 선형 변환한 그래프 ( X + Y + Z = 1) CIE XYZ
  • 그래서 인지된 색차가 맵상의 거리에 비례하도록 만들어줌

  • HSV 모델 ( Hue, Saturate, Value) : 색상, 채도, 밝기
    • 우세 주파수의 색상, 색상의 선명도, 빛의 총량 ( 아까 RGB 그림에 있음)
      직선축으로만 이루어지는 타 색구성법과는 달리 원기둥이 모태인  곡면기하형 색 구조 를 하고 있음
      • 하지만 어두운 영역의 채도 값은 신뢰할 수 없음
        • (0.5,0,0), (1,0,0) 모두 채도가 1

 

  • 낮은 채도 값을 갖는 컬러를 평가할 때 색상(Hue)에 대한 신뢰도가 떨어짐
    • opencv에서 hue의 값을 8비트로 표현하기 위해 0~360의 범위를 2로 나눔

 

이진화

  • 명암 영상을 흑과 백만 가진 이진 영상으로 변환 ( T= 임계값 )
    • if ( f(j, i) ≥ T ) b(j, i) = 1
    • else ( f(j, i) < T ) b(j, i) = 0
  • 오츄 알고리즘
    • 이진화 했을 때 흑 그룹과 백 그룹이 각각 그룹내에서 균일할수록 좋다
    • 균일성은 분산으로 측정 ( 분산이 작을수록 균일성 높음 : 명암의 분포가 뭉쳐있음 )
    • 분산의 가중치의 합을 목적 함수로 이용
    • 그룹내의 분산이 가장 작게되는 argmin
      • 각 집합의 명암 분포가 균일 할 수록 좋다는 점에 착안
      • 가능한 모든 T에 대해 점수를 계산한 후 가장 좋은 T를 임계값으로 취하는 일종의 최적화 알고리즘

연결요소(connected component)

 

 

'Computer Vision > Basic' 카테고리의 다른 글

[CV 기초] #6 영역 특징  (3) 2024.04.06
[CV 기초] #5 영상 분할  (3) 2024.04.06
[CV 기초] #4 에지 검출  (2) 2024.03.26
[CV 기초] #3 모폴로지와 컨볼루션  (1) 2024.03.26
[CV 기초] #2 인식 성능 측정  (1) 2024.03.26
'Computer Vision1/Basic' 카테고리의 다른 글
  • [CV 기초] #5 영상 분할
  • [CV 기초] #4 에지 검출
  • [CV 기초] #3 모폴로지와 컨볼루션
  • [CV 기초] #2 인식 성능 측정
임승택
임승택
"Hello, I am Im Seungtaek, a computer engineering student. Nice to meet you!"
  • Lim's Technology
    임승택
    임승택
    "Welcome to Lim's Technology!"
  • 누적 조회수
    총 회
    구독하기
    • 분류 전체보기 (77)
      • Blog (6)
      • Computer Vision (31)
        • Computer Vision (2)
        • Paper reviews (16)
        • Project (6)
        • Basic (7)
      • LLM (8)
        • Paper reviews (3)
        • Project (3)
        • Basic (2)
      • Data Analysis (11)
        • Basic (8)
        • Project (3)
      • Computer Graphics (0)
        • Basic (0)
      • Robotics (5)
        • Paper reviews (3)
        • Basic (2)
      • Technology Notes (12)
      • Memo (4)
  • 인기 글

  • 최근 댓글

  • 최근 글

임승택
[CV 기초] #1 컴퓨터 비전
상단으로

티스토리툴바