'VQGAN' 태그의 글 목록

Recent Posts

Link

kalelPark's GitHub

« 2025/07 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Tags more

Today

Total

관리 메뉴

글쓰기
방명록
RSS
관리

목록VQGAN (1)

KalelPark's LAB

[ 논문 리뷰 ] Taming Transformers for High-Resolution Image Synthesis

Abstract Transformer는 상당한 표현력을 지니고 있지만, high-resolution images와 같이 long sequence에 대해서는 상당히 계산이 취약합니다. 본 논문에서는 어떻게 CNN의 inductive bias와 transformer의 표현력을 어떻게 결합해야하는지 증명하고, 고해상도 이미지를 만드는 방법을 언급합니다. 또한, CNN을 사용하여 Image constituents의 context-rich vocabulary를 어떻게 학습하는지 보여주고, transformer를 활용하여 high-resolution images의 구성을 효율적으로 모델링하는 방법을 성명합니다. 우리의 접근법은 object class, spatial information과 같은 비공간적 정보를 가진..

Data Science/Generative Adversarial Networks 2023. 4. 9. 12:55

이전 Prev 1 Next 다음

목록VQGAN (1)

KalelPark's LAB

티스토리툴바