본문 바로가기
반응형

딥러닝 머신러닝 데이터 분석/BoostCampAITech25

[LV.3] 경량화 # CV경량화 강의 메모는 생략되었음 CV vs NLP NLP의 경우 CV에 비해 모델 구조의 다양성이 떨어짐, 거대한 transformer 구조가 대부분 -> Knowledge distilation을 사용하기 유리 -> 학계와 현업간의 이식성이 높음 BERT profiling Ganesh, Prakhar, et al.,2021에 따르면 - 일반적으로 CPU의 연산속도가 더 빠름 - 고등한 computation 이 많은 모듈일 수록 이 차이가 더 극명함 (matmul, softmax 등) Structured Pruning vs Unstructured Pruning Structured Michel et al., 2019에 의하면 - MHA를 위해서 꼭 Multi-Head가 필요한가? -> 그렇지만은 않다... 2021. 11. 30.
[LV.3 모델 최적화] #5 Augmentation 1 2 image augmentation shear : 비틀기 Translate : 이동 Rotate : 회전 Contrast : 대비 Invert : 역전 Equalize : color histogram 평활화, 색 대비 혹은 색 표현이 풍부해 짐 AutoContrast : 파라미터는 없고 Contrast histogram을 더 평탄화함 Solarize : threshold 를 넘는 픽셀에서 invert Posterize : quantization. 표현을 더 낮은 비트 수로 표현 Color : color balance brightness Cutoff : 이미지에 구멍 뚫기3 issue 숫자 같은 경우는 뒤집어지면 의미가 달라지는 경우가 생긴다. 과한 augmentation은 절대 존재할 수 없는 이미.. 2021. 11. 24.
[LV3 모델최적화] #2, #3 2 ShuffleNetv2 속대에 영향을 주는 요소 FLOPs 이외의 Memory Access Cost 등의 관점에서 속도에 영향을 주는 요소들이 많다. 논문에서는 4가지 가이드 라인 제시 입출력 크기가 동일할 때 convolution group의 크기 path의 분기 수 Element-wise operation 3 1 좋은 config를 찾을 때 까지 사람이 지속적으로 tunning AutoML을 이용해서 완전한 loop with out human 구현 DL config는 conditional search space를 가짐 SGD : lr, momentum / Adam : lr, beta1, beta2 .... 2 Bayesian Optimization Surrogate model (Gaussian p.. 2021. 11. 24.
[Lv2 P-Stage] 2 stage Detectors R-CNN - 객체가 있을만한 후보위치(Region of Interest)를 기존의 알고리즘으로 예측 - 예측된 후보 위치를 crop 후 warpping - warpping 된 이미지를 분류 - sliding window 는 너무 많은 경우의 수 -> Selective search 를 이용해서 후보 추출 - 아래의 step으로 진행 1) 입력 이미지 받기 2) Selective search 적용 : 하나의 이미지에서 2000개의 RoI 추출 3) 동일한 size로 warpping : 분류기의 마지막에 fc레이어에서는 고정된 사이즈를 받아야함 4) warpping된 RoI를 CNN 에 넣어 feature 를 추출 5) 추출된 feature를 SVM에 넣어서 분류 진행 6) regression을 진행해서 b.. 2021. 10. 6.
[Lv2 P-Stage] Object Detection Overview -Introduction classification은 한 이미지에 하나의 정답이 나오지만 Object detection은 하나의 이미지에 여러가지 정답이 있을 수 있어서 훨씬 어렵다. sementic segmentation은 객체의 영역이 어디인지 그리고 그 영역안에 있는 사물이 무엇인지 알아내지만 instance segmentation은 객체의 종류 뿐만 아니라 서로 다른 물체는 서로 다른 객체로 인지하는 task다. Object detection은 테슬라의 자율주행, 의료도메인 등등 실생활에서도 전반벅으로 사용되고 있다. - Evaluation 객체검출의 2가지 Evaluation : mAp(성능 지표), FLOP, FPS(계산 속도) mAP : mean average precision 각 클래스당 .. 2021. 9. 27.
[CV] Further topics of segmentation 더 진보된 segmentation, Instance segmentation Mask R-CNN[he et al., ICCV 2017] - RoI Align을 제안함 - Faster R-CNN + Mask branch(새롭게 제안) - 원하는 class의 수 만큼 channel을 가지는 마스크를 한번에 추론 YOLACT[Bolya et al., ICCV 2019] - Protonet을 통한 프로토타입, 마스크를 만들 수 있는 후보군을 추론 - 적은 수의 프로토타입의 선형결합으로 여러가지 디텍션을 만들어 내는 효과적인 구조 YolactEdge - Feature pyramid에서 발생하는 이전 frame의 feature map을 이후 frame의 feature map으로 전달 더 진보된 segmentation.. 2021. 9. 19.
반응형