본문 바로가기
반응형

딥러닝 머신러닝 데이터 분석/BoostCampAITech25

[CV] Object detection Fundamental image recognition tasks[Kirillov et al., CVPR 2019] - Semantic segmentation [instance recognition : X | semantic recognition : O] - Instance segmentation [instance recognition : O | semantic recognition : X] - Panoptic segmentation [instance recognition : O | semantic recognition : O] Further topic - Object detection [classification + Box localization] - OCR Traditional method (hand .. 2021. 9. 12.
[CV] Semantic segmentation Sementic segmentation - A classification peoblem for each pixel - Not about classifications of instances. Fully Convolutional Networks(FCN)[Long et al., CVPR 2015] - the first end-to-end architecture for semantic segmentation - Convolution networks without a flatten layer(input resolution free) - 1x1 convolution : the same operation with fc layer for each spatial point. - low resolution of featu.. 2021. 9. 9.
[CV] Image Classification 2 1 Going deeper with convolutions - The deeper model is the better model because of larger receptive fields. - The deeper model is the better model because of larger infomation capacity and non-linearity. - Is it real? -> harder to optimize (gradient vanishing, exploding, degradation problem) 2.1 GoogLeNet[Szegedy et al., CVPR 2015] - deeper and wider convolution architecture. - channelwise compr.. 2021. 9. 8.
[CV] 0. Computer Vision OT & 1. Image Classification 1 & 2. Annotation data efficient learning CV란? Computer Graphics는 익숙하다. Computer Vision이란 Computer Graphics의 반대되는 개념. 즉 CV는 Inverse Computer Graphics. AI, 인공지능이란 인공지능의 가장 좋은 reference는 인간. 인간은 어릴때 오감을 활용한 지각능력을 발달시키는 것을 지능의 시발점으로 삼는다. 시각을 통한 인지와 닮아있다. 실제 사물 -> Computer Vision -> Representation -> Rendering -> Computer Graphic CV에서 ML 과 DL 의 가장 큰 차이점 Feature extraction을 Classifier가 동시에 함으로 인간의 선입견이나 지각적 한계를 뛰어넘을 수 있다. Image Classificatio.. 2021. 9. 7.
[P-Stage] 마스크 데이터 분류 대회 리포트 - 2 실험 2 - Classification Model 분류 문제를 진행함에 있어 성능을 저하시킬 수 있는 요소들을 배제하고 실험할 수 있도록 데이터를 설계후 실험 진행 실험 2. 1 가설 : 데이터를 분석해본 결과 각 라벨별로 가장 수가 적은 라벨의 데이터는 83 장의 사진이고 그 다음으로 적은 수의 데이터는 109 장인 것으로 나타남. 따라서 라벨당 데이터를 100장씩 뽑아서 subsampling 할 경우 충분히 균등한 데이터셋을 만들 수 있음. 18개의 라벨에 대해서 각 100장씩 뽑으면 1800장의 사진이 확보됨. 이 사진에 대해서 분류문제 진행. 검증 : ResNet18을 이용하여 미리 학습하지 않은 모델과 ImageNet에 대해서 학습된 모델을 각각 해당 이미지 세트에 훈련함. 훈련시 대회의 Met.. 2021. 9. 3.
[P-Stage] 마스크 데이터 분류 대회 리포트 - 1 대회 목적 사람의 얼굴이 찍힌 사진을 인식하여 나이 / 성별 / 마스크 착용상태를 동시에 예측하는 모델 만들기 EDA 주의 : 대회에 사용된 모든 사진은 캠프 교육에만 활용될 수 있음. 외부 유출 금지. 메타 데이터 CSV 형태의 메타데이터가 주어지고 ID, 성별, 나이, 인종 이 주어짐. 이 셋을 "_"로 조합하면 해당 인물에 대한 사진이 들어있는 폴더 경로가 주어짐. 각 인물당 마스크를 바르게 착용한 사진 3장, 착용하지 않은 사진 1장, 바르지 않게 착용한 사진 1장 총 7장의 사진이 주어짐. 예측해야하는 라벨은 성별 : 남/녀 마스크 : 착용 / 미착용 / 오착용 나이 : 30세 미만 / 30세 이상 / 60세 미만 / 60세 이상 의 총 18가지 라벨을 예측. 성별 남녀간의 성비를 조사한 결과 .. 2021. 9. 3.
반응형