인공지능/컴퓨터 비전

Semantic Segmentation (의미적 분할)

백관구 2022. 8. 28. 20:44
반응형

이미지 분할(Image Segmentation)이란?

  • 컴퓨터 비전(Computer vision)의 한 분야
  • 이미지를 몇 개의 영역으로 구분하는 작업
  • 이미지의 공간 영역, 객체들을 픽셀 수준에서 구분하여 라벨을 지정하는 작업

 

참고 : https://www.v7labs.com/blog/image-segmentation-guide

    위 그림에서 첫번째 Classification (분류)는 입력 이미지의 전반적인 클래스(대체로 하나의 클래스)를 예측하는 것이 목적이다. 두번째 Object Detection (객체 탐지)는 입력 이미지 내 모든 물체의 클래스와 위치를 예측하는 것이 목적이다. 세번째 Segmentation (분할)은 입력 이미지 내 모든 픽셀의 클래스를 예측하는 것이 목적이다.

 


 

이미지 분할(Image Segmentation)의 종류

  1. 의미적 분할 (Semantic segmentation)
  2. 객체 분할 (Instance segmentation)
  3. 판옵틱 분할 (Panoptic segmentation)

Image Segmentation 종류

 

  Semantic (의미적) Instance (인스턴스) Panoptic (판옵틱)
클래스 구분 가능 O
(형태가 뚜렷한 경우 구분)
O
객체 구분 가능 X O O

 

1. Semantic Segmentation (의미적 분할)

Semantic Segmentation

  • 이미지를 구성하는 모든 픽셀에 대해 클래스를 예측
  • 분할된 이미지의 클래스를 구분할 수 있지만, 동일한 클래스의 영역이 겹쳐지는 경우(ex. 군중) 같은 영역으로 인식하기 때문에 각 객체를 구분할 수는 없음
  • 대표적인 평가지표는 MIoU (Mean Intersection over Union)로, 자카드 지수(Jaccard index)라고도 함

참고 : https://en.wikipedia.org/wiki/Jaccard_index
참고 : https://en.wikipedia.org/wiki/Jaccard_index

 

2. Instance Segmentation (객체 분할)

Instance Segmentation

  • 객체 탐지(Object detection)처럼 객체를 구분하는 작업을 픽셀 수준에서 진행
  • 의미적 분할과 다른 점은 겹쳐져 있는 동일한 클래스의 객체 구분이 가능
  • 모든 픽셀에 라벨을 지정하지 않고, 관심 영역(RoI; Region of Interest)에 대해서 라벨을 예측
  • 대표적인 평가지표는 MAP (Mean Average Precision)

 

3. Panoptic Segmentation (판옵틱 분할)

Panoptic Segmentation

  • "의미적 분할 + 객체 분할"이라 보면 됨
  • 대표적인 평가지표는 PQ (Panoptic Quality) = SQ (Semantation Quality) * RQ (Recognition Quality)

 

반응형

 


 

Semantic Segmentation 관련 데이터셋

1. Cityscapes

Cityscapes : Stuttgart

  • 도시 길거리 이미지
  • 30개 클래스
    • 도로(road) / 보행로(sidewalk) / 사람(person) / 오토바이(motorcycle) / 자전거(bicycle) / 건물(building) / 기둥(pole) / 교통표지(traffic sign) / 식물(vegetation) / 하늘(sky) 등

 

2. CamVid

CamVid : seq06R0

  • 도시 길거리 이미지
  • 32개 클래스
    • 도로(Road) / 차선(LaneMkgsDriv) / 자동차(Car) / 건물(Building) / 나무(Tree) / 식물(VegetationMisc) / 기둥(Column_Pole) 등

CamVid 32 Classes

 


 

이미지 분할을 위한 라벨링 도구

  • V7, Labelbox, ScaleAI, SuperAnnotate, DataLoop

 


 

Semantic Segmentation 관련 딥러닝 모델

모델명 연도 논문명 (링크)
FCN
(Fully Convolutional Network)
2015 Fully Convolutional Networks for Semantic Segmentation (Long et al.)
U-net 2015.05 U-Net: Convolutional Networks for Biomedical Image Segmentation (Ronneberger et al.)
ParseNet 2015.06 ParseNet: Looking Wider to See Better (Liu et al.)
DeepLab 2016.06 DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs (Chen et al.)
PSPNet
(Pyramid Scene Parsing Network)
2016.12 Pyramid Scene Parsing Network (Zhao et al.)

 

반응형