본문 바로가기
딥러닝 머신러닝 데이터 분석/BoostCampAITech

[Lv2 P-Stage] Object Detection Overview

by SteadyForDeep 2021. 9. 27.
반응형

-Introduction

classification은 한 이미지에 하나의 정답이 나오지만

Object detection은 하나의 이미지에 여러가지 정답이 있을 수 있어서 훨씬 어렵다.

 

sementic segmentation은 객체의 영역이 어디인지 그리고 그 영역안에 있는 사물이 무엇인지 알아내지만

instance segmentation은 객체의 종류 뿐만 아니라 서로 다른 물체는 서로 다른 객체로 인지하는 task다.

 

Object detection은 테슬라의 자율주행, 의료도메인 등등 실생활에서도 전반벅으로 사용되고 있다.

 

- Evaluation

객체검출의 2가지 Evaluation : mAp(성능 지표), FLOP, FPS(계산 속도)

 

mAP : mean average precision

각 클래스당 average precision을 계산한 평균값

 

- Confusion matrix

예측과 정답이 각각 2가지이므로 나올 수 있는 경우의 수는 4가지가 있다.

 

- Precision

모델의 예측 관점에서 볼 수 있는 값. 모델이 참이라고 예측한 값들중에서 진짜 참인값.

 

- Recall

정답 관점에서 볼 수 있는 값. 정답이 positive 인 case 중에서 맞춘 것은 몇개냐?

 

-PR Curve

Ground Truth, 예측 비교 -> TP/FP 구분할 수 있을 때

Confidence 를 측정할 수 있을 때

 

Confidence 로 내림차순 정리를 한 후 누적된 TP와 FP로 부터 Precision, Recall 을 계산

이렇게 측정된 Precision과 Recall 을 이용해서 그래프를 그릴 수 있다

그렇게 그려진 커브를 PR Curve 가 된다.

Average Precision은 PR Curve의 아래 면적이 된다.

 

- IOU(Intersection Over Union)

Ground Truth와 예측한 bbox의 합집합 분에 교집합

이 값을 통해서 얼마나 겹치는지 수치화 할 수 있고 옳게 예측한 값과 그렇지 못한 값을 구분할 수 있다.

 

단순하게 mAP만 사용하는게 아니라 IOU 값이 얼마일때 mAP인지 나타내야 정확한 비교가 가능하다.

IOU가 높은 mAP일 수록 더 엄격한 측정이라고 할 수 있다.

 

-FPS(Frames Per Second)

초당 연산가능한 프레임 수

높을 수록 빠르다.

 

-FLOPs(Floating Point Operations)

모델 연산을 위해서 얼마나 많은 계산이 필요한지 나타내는 수.

낮을 수록 빠르다.

 

Library

 

- MMDetection

파이토치 기반의 디텍션 라이브러리

 

-Detectron2

facebook에서 만든 파이토치 기반의 라이브러리

 

-YOLOv5

-EfficientDet

와 같은 오픈소스 라이브러리들이 있다.

반응형

댓글