일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- GAN
- 알고리즘
- Front
- 3d
- Torch
- 자료구조
- CV
- algorithm
- computervision
- pytorch
- 머신러닝
- PRML
- Python
- math
- FGVC
- nlp
- SSL
- clean code
- Meta Learning
- FineGrained
- Depth estimation
- 딥러닝
- dl
- nerf
- ML
- cs
- Vision
- web
- classification
- REACT
- Today
- Total
목록Data Science/PRML (13)
KalelPark's LAB
Reference https://blog.naver.com/PostView.naver?blogId=wpxkxmfpdls&logNo=221737078357&categoryNo=14&parentCategoryNo=0&from=thumbnailList
Gaussian Distribution ~ Normal Distribution 연속 확률 분포 중 가장 널리 알려진 분포이다. 아래의 수식은, 단일 변수 x에 대해 가우시안 분포를 기술한 것이다. 만약, D차원의 벡터인 경우, 분산 대신 공분산 D가 입력으로 사용되게 된다. (아래의 수식 참고) 중심 극한 정리(Central Limit Theorem) 각각의 데이터 집단에서의 평균이 u이고, 분산이 시그마의 제곱인 모집단에서 추출한 확률 표본이라고 하자. 이 때, X를 n개의 표본에서 얻은 표본평균이라고 할 때, n이 커질수록 표준 정규분포에 수렴한다는 것입니다. 즉, 모집단에 대한 특정 분포에 상관 없이, 샘플 사이즈가 크다면, 표본 평균의 분포는 정규분포에 근사하게 된다는 것입니다. 대한민국 전체 남..
Mutlinomial distribution 베르누이 확률변수(Bernoulli distribution)의 데이터가 복수이면, 이 데이터의 합이 이항 분포를 이루는 것처럼 카테고리 확률변수의 데이터가 여러 개 있으면 데이터의 합은 다항분포(Mutlinomial distribution)가 된다. 여러 번의 독립시행에서 각각의 값이 특정 횟수가 나타날 확률을 의미하기도 합니다. 간단한 예시로는, 동전을 던졌을 때, 앞면이 나올 횟수에 관환 분포는 이항분포라고 하고, 동전을 던졌을 때, 각 면이 나올 횟수에 대한 분포는 다항분포라고 합니다. Dirichlet Distribution k 차원의 실수 벡터 중 벡터의 요소가 양수이며, 모든 요소를 더한 값이 1인 경우에 확률 값이 정의되는 연속확률분포입니다. 즉,..
감마 분포(Gamma distribution) 우선, 감마 분포(Gamma distribution)에 대해서 살펴보도록 하겠습니다. 감마 함수는 Factorial을 자연수에만 한정해서 사용하지 않고, 더 큰 수 체계에서도 적용할 수 있는 방법을 고민하다가 나온 함수라고 합니다. 즉 복소수 범위까지 일반화된 Factorial을 의미합니다. 지수 분포를 한 번의 사건이 아닌 여러 개의 사건으로 확장한 것이라고 할 수 있습니다. 감마 분포(Gamma distribution)는 통상적으로 포아송 분포의 모수의 역수를 사용합니다. 즉, 모수가 β인 지수분포에서 β는 사건 사이 평균 소요시간을 의미합니다. 아래의 그래프의 경우 각 α,β 모수에 따른 Gamma Distribution입니다. α 가 증가할수록 평균과..
포아송 분포(Poisson Distribution) 어떤 단위 구간(시간)에서 일어나는 특정 사건의 발생 횟수 분포에 대한 것을 의미합니다. 즉, 포아송 분포를 통하여, 평균 발생 횟수가 5개가 되는 단위 구간에서 사건이 3개 일어날 확률은 어느정도가 되는지 구할 때 사용합니다. 해당 구간 내 사건은 랜덤으로 일어나므로 정확한 타이밍은 예측하는 것이 불가능합니다. * 포아송 분포(Poission distribution)을 따른다면, 다음의 성질을 만족해야 합니다. 1. 서로 겹치지 않는 단위 구간에서 발생하는 사건들은 서로 독립이다. 2. 단위 구간의 크기 대비 사건의 평균 발생 횟수의 비율은 일정하다. 3. 같은 사건이 동시에 일어날 확률은 0이다. * 여기서 눈여겨볼 점은 포아송 분포는 기댓값과 분산..