마일스톤
개요
지난 object detection에 이어 Segmentation을 적용하는 챌린지 진행.
Objective
- 사진에서 쓰레기를 Sementation하는 모델
- Input : 쓰레기 객체가 담긴 이미지
- segmentation annotation : COCO format
- Output : pixel 좌표에 따라 카테고리 값
Data

- Annotation file (coco format)
- images
- id: 파일 안에서 image 고유 id, ex) 1
- height: 512
- width: 512
- filename: ex) batch01_vt/002.jpg
- annotations
- id: 파일 안에 annotation 고유 id, ex) 1
- segmentation: masking 되어 있는 고유의 좌표
- bbox: 객체가 존재하는 박스의 좌표 (xmin, ymin, w, h)
- area: 객체가 존재하는 영역의 크기
- category_id: 객체가 해당하는 class의 id
- image_id: annotation이 표시된 이미지 고유 id
실험 결과
Installation Issue
- nvidia-Apex
- ViT-Adapter > Usage
- Deformable DETR install