| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
- FineGrained
- cs
- computervision
- clean code
- Depth estimation
- dl
- Front
- math
- PRML
- 딥러닝
- CV
- nlp
- 알고리즘
- rl
- Meta Learning
- algorithm
- web
- SSL
- nerf
- pytorch
- 자료구조
- 3d
- 머신러닝
- Torch
- classification
- FGVC
- ML
- Python
- REACT
- Vision
- Today
- Total
KalelPark's LAB
[3D Diffusion / GenAI] Score Distillation Sampling 본문
[3D Diffusion / GenAI] Score Distillation Sampling
kalelpark 2025. 12. 25. 10:15Score Distillation Sampling
Score Distillation Sampling(SDS)은 사전 학습된 diffusion 모델을 학습 대상이 아닌 고정된 target(teacher) 으로 두고, 이 모델이 제공하는 score(이미지가 텍스트 조건에 맞는 방향 정보) 만을 활용해 새로운 모델을 학습하는 방법이다. SDS에서는 정답 이미지나 실제 데이터셋, 혹은 GAN에서 사용하는 판별기와 같은 명시적인 감독 신호가 전혀 필요하지 않으며, 오직 현재 모델이 생성한 결과가 diffusion 모델이 학습한 데이터 분포와 텍스트 조건에 얼마나 부합하는지를 나타내는 gradient 방향만을 사용한다. 구체적으로는, 학습 중인 모델이 생성한 이미지에 noise를 추가한 뒤 이를 target diffusion 모델에 입력하고, diffusion 모델이 예측한 noise와 실제로 주입한 noise의 차이를 통해 score를 추정한다. 이 score는 “이 이미지를 어떤 방향으로 바꾸면 텍스트에 더 잘 맞는 이미지가 되는가”를 알려주는 신호이며, SDS는 이를 loss처럼 사용해 파라미터를 업데이트한다.

Delta Distillation Sampling
Delta Distillation Sampling(DDS)은 Score Distillation Sampling과 마찬가지로 사전 학습된 diffusion 모델을 고정된 target으로 사용하며, 실제 데이터나 정답 이미지 없이 학습을 진행하는 방법이다. DDS에서는 diffusion 모델이 제공하는 절대적인 score 자체를 직접 사용하기보다는, 서로 다른 두 상태(또는 두 예측) 사이의 차이, 즉 delta 정보에 집중한다. 구체적으로, 현재 모델이 생성한 이미지와 기준이 되는 다른 예측 결과를 각각 diffusion 모델에 통과시켜 얻은 score들의 차이를 계산하고, 이 차이가 나타내는 방향을 학습 신호로 사용한다. 이 delta score는 “현재 결과가 기준에 비해 어떤 방향으로 얼마나 벗어나 있는가”를 명확하게 드러내므로, SDS에서 흔히 발생하는 gradient noise나 불안정성을 줄이는 데 도움이 된다. 이 과정에서도 diffusion 모델은 전혀 학습되지 않고, 오직 score 차이를 제공하는 역할만 수행하며, 학습 대상 모델은 이 delta 신호를 따라 업데이트된다.

CODE 차이

'Advanced 3D vision > 3D Diffusion' 카테고리의 다른 글
| [3D Diffusion / GenAI] Flow Matching (0) | 2025.12.05 |
|---|---|
| [3D Diffusion / GenAI] Reverse Process & Probability ODE (0) | 2025.12.04 |
| [3D Diffusion / GenAI] Variational Preserving and Exploding (0) | 2025.12.04 |
| [3D Diffusion / GenAI] Diffusion Models for Continuous (0) | 2025.12.04 |
| [3D Diffusion / GenAI] Classifier Guidance and Free Guidance (0) | 2025.12.02 |