Recent Posts
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- FGVC
- PRML
- nerf
- computervision
- Meta Learning
- nlp
- FineGrained
- 머신러닝
- Vision
- pytorch
- dl
- 알고리즘
- Front
- GAN
- algorithm
- 딥러닝
- ML
- web
- CV
- REACT
- clean code
- Torch
- Depth estimation
- Python
- SSL
- cs
- classification
- 자료구조
- 3d
- math
- Today
- Total
목록VQGAN (1)
KalelPark's LAB
[ 논문 리뷰 ] Taming Transformers for High-Resolution Image Synthesis
Abstract Transformer는 상당한 표현력을 지니고 있지만, high-resolution images와 같이 long sequence에 대해서는 상당히 계산이 취약합니다. 본 논문에서는 어떻게 CNN의 inductive bias와 transformer의 표현력을 어떻게 결합해야하는지 증명하고, 고해상도 이미지를 만드는 방법을 언급합니다. 또한, CNN을 사용하여 Image constituents의 context-rich vocabulary를 어떻게 학습하는지 보여주고, transformer를 활용하여 high-resolution images의 구성을 효율적으로 모델링하는 방법을 성명합니다. 우리의 접근법은 object class, spatial information과 같은 비공간적 정보를 가진..
Data Science/Generative Adversarial Networks
2023. 4. 9. 12:55