Recent Posts
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 알고리즘
- ML
- Depth estimation
- SSL
- Python
- Vision
- 딥러닝
- nerf
- algorithm
- 3d
- classification
- FGVC
- computervision
- CV
- clean code
- GAN
- 자료구조
- 머신러닝
- REACT
- math
- FineGrained
- Meta Learning
- Torch
- PRML
- nlp
- web
- cs
- Front
- pytorch
- dl
- Today
- Total
목록clip (1)
KalelPark's LAB
[ Vision Language ] Learning Transferable Visual Models From Natural Language Supervision
Abstract Image에 대한 text로부터 학습하는 것은 Supervision에서 상당히 유망있는 분야입니다. Image 와 text 쌍을 pretraining 시킴으로써, 상당한 SOTA를 달성함을 본 논문에서는 증명합니다. NLP는 visual concept을 추론하는데 사용될 수 있으며, zero-shot transfer model로 사용되는 것이 가능합니다. Overview CNN 기반 모델들이, 강한 면모를 보여주기는 하지만, zero-shot에서는 매우 낮은 성능을 보입니다. 본 논문에서는 대규모 데이터셋(Image + text)로부터, 학습하여 상당히 좋은 결과를 얻습니다. Contrastive Learning과 유사하게, Image와 text를 하나의 공통된 space로 보낸 다음, ..
Data Science/Vision Language Model
2023. 3. 25. 11:00