-Introduction
classification은 한 이미지에 하나의 정답이 나오지만
Object detection은 하나의 이미지에 여러가지 정답이 있을 수 있어서 훨씬 어렵다.
sementic segmentation은 객체의 영역이 어디인지 그리고 그 영역안에 있는 사물이 무엇인지 알아내지만
instance segmentation은 객체의 종류 뿐만 아니라 서로 다른 물체는 서로 다른 객체로 인지하는 task다.
Object detection은 테슬라의 자율주행, 의료도메인 등등 실생활에서도 전반벅으로 사용되고 있다.
- Evaluation
객체검출의 2가지 Evaluation : mAp(성능 지표), FLOP, FPS(계산 속도)
mAP : mean average precision
각 클래스당 average precision을 계산한 평균값
- Confusion matrix
예측과 정답이 각각 2가지이므로 나올 수 있는 경우의 수는 4가지가 있다.
- Precision
모델의 예측 관점에서 볼 수 있는 값. 모델이 참이라고 예측한 값들중에서 진짜 참인값.
- Recall
정답 관점에서 볼 수 있는 값. 정답이 positive 인 case 중에서 맞춘 것은 몇개냐?
-PR Curve
Ground Truth, 예측 비교 -> TP/FP 구분할 수 있을 때
Confidence 를 측정할 수 있을 때
Confidence 로 내림차순 정리를 한 후 누적된 TP와 FP로 부터 Precision, Recall 을 계산
이렇게 측정된 Precision과 Recall 을 이용해서 그래프를 그릴 수 있다
그렇게 그려진 커브를 PR Curve 가 된다.
Average Precision은 PR Curve의 아래 면적이 된다.
- IOU(Intersection Over Union)
Ground Truth와 예측한 bbox의 합집합 분에 교집합
이 값을 통해서 얼마나 겹치는지 수치화 할 수 있고 옳게 예측한 값과 그렇지 못한 값을 구분할 수 있다.
단순하게 mAP만 사용하는게 아니라 IOU 값이 얼마일때 mAP인지 나타내야 정확한 비교가 가능하다.
IOU가 높은 mAP일 수록 더 엄격한 측정이라고 할 수 있다.
-FPS(Frames Per Second)
초당 연산가능한 프레임 수
높을 수록 빠르다.
-FLOPs(Floating Point Operations)
모델 연산을 위해서 얼마나 많은 계산이 필요한지 나타내는 수.
낮을 수록 빠르다.
Library
- MMDetection
파이토치 기반의 디텍션 라이브러리
-Detectron2
facebook에서 만든 파이토치 기반의 라이브러리
-YOLOv5
-EfficientDet
와 같은 오픈소스 라이브러리들이 있다.
'딥러닝 머신러닝 데이터 분석 > BoostCampAITech' 카테고리의 다른 글
[LV3 모델최적화] #2, #3 (0) | 2021.11.24 |
---|---|
[Lv2 P-Stage] 2 stage Detectors (0) | 2021.10.06 |
[CV] Further topics of segmentation (0) | 2021.09.19 |
[CV] Object detection (0) | 2021.09.12 |
[CV] Semantic segmentation (0) | 2021.09.09 |
댓글