KITTI
- KITTI 데이터셋은 2012년 공개하였으며, 그 당시에는 구성하기 힘든 센서들로 취득한 데이터이다
- 만약 카메라 외 다른 센서를 추가로 사용한다면 각 센서의 위치와 좌표계 확인이 필요하다
- KITTI 데이터셋의 객체 인식은 2D Object Detection, 3D Object Dection 그리고 BEV 시점에서의 객체 인식 데이터를 제공한다
- 2D Object Detection
- Left, Right 이미지
- LiDAR 데이터
- Calibration 정보
- 레이블링 데이터
BDD100K
- BDD100K 데이터셋은 2017년 공개하였으며, 자율주행을 위한 다양한 딥러닝 어플리케이션 데이터셋이다
- 다양한 도시, 다양한 환경(날씨, 시간)에 대한 데이터로 보다 현실적인 상황을 담으려고 한다
- Object Detection, Segmentation, Lane Marking 등 다양한 데이터가 존재한다
Cityspace
- Cityspace는 다양한 도시의 도로 Semantic Segmentation 데이터이다
- Segmentation은 객체의 형태를 다각형으로 표현한다
- Bbox를 그리기 위해 4개의 포인트가 필요했다면, 다각형은 N개의 포인트를 사용한다
scale
- Scale은 자율주행과 관련된 다양한 데이터를 전체적으로 확인할 수 있는 사이트이다
Papers With Code
- Paper With Code는 코드와 함께 공개한 논문들을 모아둔 사이트로 SOTA 모델을 활용해보기에 좋다
- SOTA(State-of-the-Art) 모델이 굉장히 빠른 속도로 갱신되고 있다
- 논문에 사용된 코드를 공개하는 비율이 높아 다른 사람들이 쉽게 논문에 사용된 모델을 재현할 수 있다
Data Labeling
- Labeling은 확보한 Raw Data를 유의미한 작업에 사용하도록 데이터를 만드는 작업이다
- Labeling 또는 Annotation, Tagging이라 부르기도 한다
- Computer Vision에서는 주로 이미지에 필요한 Classification, Detection 등의 작업에 대해 결과를 미리 입력하는 행위이다
- 이렇게 만들어진 데이터는 모델이 만들어낼 수 있는 최대 검출(또는 분류) 성능이 될 수 있고, 또 다른 데이터를 만들어내는 재료가 되기도 한다
- 효율적인 작업을 위해서는 데이터 구축 프로세스를 만들어야 한다
- CVAT
- Docker Image를 제공하여 편리하게 설치할 수 있다
- Labeling 데이터 배포 시 KITTI, Cityspace, YOLO 등 다양한 포맷의 데이터로 변환이 가능하다
Data Augmentation
- Data Labeling을 최소화하면서 보다 효과적인 데이터 증강 방법들이 제안되고 있다
- 데이터 증가의 기본 개념은 데이터가 가지고 잇는 고유한 특징/특성에 추가, 변경, 제거를 통해 새로운 이미지를 만드는 것이다
- 이미지 색공간 변형 → Crop, Median Blur, Contrast, Hue/Saturation/Value, Gamma
- 기하학적 형태 변형 → Vertical Flip, Horizontal Flip, RandomRotate90, Transpose, ShiftScaleRotate, RandomSizedCrop
- 이미지 왜곡 → GridDistortion, ElasticTransform
- 라이브러리
- imgaug
- Albumentations