전체 글

딥러닝 논문 리뷰 & 딥러닝 아티클

논문 리뷰

📎빠르게 보는 CLIP 논문 리뷰📎

2023.03.01

CLIP : Learning Transferable Visual Models From Natural Language Supervision 2021년 등장한 CLIP은 VL(Vision language) pretraining 분야의 새로운 패러다임을 열었습니다. 기존의 고정된 class label(cat, dog 등)을 활용한 supervised learning은 이미지의 semantic 정보를 제대로 추출해내지 못한다는 한계가 존재했는데요. 충분히 성능 좋은 image, text encoder가 있음에도 불구하고, 필요한 정보들을 얻지 못한다는 것은 다양한 downstream tasks(Image retrieval, Image captioning, VQA 등..)에 적용하기 매우 힘들다는 것을 의미합니다..

📎빠르게 보는 CLIP 논문 리뷰📎

티스토리툴바