Recent Posts
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- classification
- REACT
- web
- Python
- pytorch
- nlp
- clean code
- computervision
- math
- Torch
- nerf
- cs
- FGVC
- 딥러닝
- dl
- Front
- PRML
- GAN
- CV
- 알고리즘
- FineGrained
- 자료구조
- 3d
- ML
- Vision
- Meta Learning
- 머신러닝
- Depth estimation
- algorithm
- SSL
- Today
- Total
KalelPark's LAB
[ Computer Vision ] Drop과 관련된 여러 기법들 본문
Overfitting & Generalization
딥러닝 모델은 데이터가 많을수록 높은 성능을 나타냅니다. 그러나, 데이터가 많다고 해서 "Overfitting"으로 인하여
모델 성능이 항상 좋은 것은 아닙니다.
- 모델의 복잡도(power)가 높으면 학습에서 데이터의 경향성을 따라가는 경향이 있습니다.
- "Overfitting"
Dropout
- 대표적인 generalization 기법입니다. (https://jmlr.org/papers/v15/srivastava14a.html)
- 학습 과정에서 특정 node들을 p의 확률로 사용하겠다는 의미이다.
- Dropout을 적용하면, 적용하지 않은 것과 비교하여 각 node들의 output이 증가함
Dropconnect
- Dropout의 조금 일반화된 version입니다 (http://proceedings.mlr.press/v28/wan13.pdf)
- Dropout의 일반화된 version (Node가 아닌 Weight을 제거하는 방법)
Droppath
- FractalNet에서 제안 (https://arxiv.org/pdf/1605.07648.pdf)
- FractalNet의 한 path 내의 weight을 모두 제거하는 방식입니다.
DropBlock
- 랜덤하게 몇개의 activation을 선택해서 지우는 방법 (https://arxiv.org/abs/1810.12890)
'Data Science > Common' 카테고리의 다른 글
[ Computer Vision ] 3D Reconstructure Survey (상시 업데이트) (0) | 2023.04.28 |
---|---|
[ Computer Vision ] Collapse란? (0) | 2023.04.22 |
[ Computer Vision ] Sparsely Embedded Convolution이란? (0) | 2023.03.25 |
[ Computer Vision ] Sparse Convolution 이란? (0) | 2023.03.24 |
[ Computer Vision ] Batchsize에 따른 loss의 변화율 (0) | 2023.03.19 |
Comments