devskim blog
Search
🗃️

오픈 데이터셋, 라벨링, 증강

Tags
DeepLearing
Created
Jun 11, 2023 04:32 PM
Last Updated
Jul 30, 2023 09:49 AM
 
 

KITTI

  • KITTI 데이터셋은 2012년 공개하였으며, 그 당시에는 구성하기 힘든 센서들로 취득한 데이터이다
  • 만약 카메라 외 다른 센서를 추가로 사용한다면 각 센서의 위치와 좌표계 확인이 필요하다
  • KITTI 데이터셋의 객체 인식은 2D Object Detection, 3D Object Dection 그리고 BEV 시점에서의 객체 인식 데이터를 제공한다
  • 2D Object Detection
    • Left, Right 이미지
    • LiDAR 데이터
    • Calibration 정보
    • 레이블링 데이터
 

BDD100K

  • BDD100K 데이터셋은 2017년 공개하였으며, 자율주행을 위한 다양한 딥러닝 어플리케이션 데이터셋이다
  • 다양한 도시, 다양한 환경(날씨, 시간)에 대한 데이터로 보다 현실적인 상황을 담으려고 한다
  • Object Detection, Segmentation, Lane Marking 등 다양한 데이터가 존재한다
 

Cityspace

  • Cityspace는 다양한 도시의 도로 Semantic Segmentation 데이터이다
  • Segmentation은 객체의 형태를 다각형으로 표현한다
  • Bbox를 그리기 위해 4개의 포인트가 필요했다면, 다각형은 N개의 포인트를 사용한다
 

scale

  • Scale은 자율주행과 관련된 다양한 데이터를 전체적으로 확인할 수 있는 사이트이다
 

Papers With Code

  • Paper With Code는 코드와 함께 공개한 논문들을 모아둔 사이트로 SOTA 모델을 활용해보기에 좋다
  • SOTA(State-of-the-Art) 모델이 굉장히 빠른 속도로 갱신되고 있다
  • 논문에 사용된 코드를 공개하는 비율이 높아 다른 사람들이 쉽게 논문에 사용된 모델을 재현할 수 있다
 
 

Data Labeling

  • Labeling은 확보한 Raw Data를 유의미한 작업에 사용하도록 데이터를 만드는 작업이다
  • Labeling 또는 Annotation, Tagging이라 부르기도 한다
  • Computer Vision에서는 주로 이미지에 필요한 Classification, Detection 등의 작업에 대해 결과를 미리 입력하는 행위이다
  • 이렇게 만들어진 데이터는 모델이 만들어낼 수 있는 최대 검출(또는 분류) 성능이 될 수 있고, 또 다른 데이터를 만들어내는 재료가 되기도 한다
  • 효율적인 작업을 위해서는 데이터 구축 프로세스를 만들어야 한다
    • CVAT
      • Docker Image를 제공하여 편리하게 설치할 수 있다
      • Labeling 데이터 배포 시 KITTI, Cityspace, YOLO 등 다양한 포맷의 데이터로 변환이 가능하다
 

Data Augmentation

  • Data Labeling을 최소화하면서 보다 효과적인 데이터 증강 방법들이 제안되고 있다
  • 데이터 증가의 기본 개념은 데이터가 가지고 잇는 고유한 특징/특성에 추가, 변경, 제거를 통해 새로운 이미지를 만드는 것이다
  • 이미지 색공간 변형 → Crop, Median Blur, Contrast, Hue/Saturation/Value, Gamma
  • 기하학적 형태 변형 → Vertical Flip, Horizontal Flip, RandomRotate90, Transpose, ShiftScaleRotate, RandomSizedCrop
  • 이미지 왜곡 → GridDistortion, ElasticTransform
  • 라이브러리
    • imgaug
    • Albumentations
NEXTObject Detection