이번 포스팅에서는 다중확률변수에 기반한 연합확률밀도함수와 조건부 확률밀도함수에 대해서 소개해보려고 한다.
1.연합확률밀도함수
저번 포스팅에 이어서 다중연속확률변수일 때의 확률밀도함수를 구하는 걸 복습겸 이어서 소개해보겠다.
포인트는 x,y라는 두 개의 확률변수로 이중적분, 이중미분을 한다는 것이다.
다음으로는 y=x라는 직선그래프의 예시와 원 그래프의 경우 두 가지로 살펴보자. 단 원 그래프 일때는 모든 구간의 확률이 일정한 Uniform Distribution이다. 각 두개의 그래프에서 x,y 특정 구간에 대해서 CDF함수를 구하는 것은 위 그림과 같다.
2. 조건부 확률분포
이번엔 조건부확률일 때의 확률분포에 대해서 알아보자. 기존처럼 확률변수가 Discrete, Continuous일 때 각각의 Case별로 알아보자.
먼저 집합의 개념에서 조건부 확률에서 확률(PDF), CDF로 바꾸는 수식을 밑의 그림을 통해 다시 복습하자.
조건부확률분포를 Discrete(이산확률변수)일 때 살펴보자. 예시를 저번 포스팅에서 들었던 동전의 예시로 살펴보자.
다중변수의 조건부확률에 대한 식은 위의 Pxy(Y=y|X=x)로 나타낼 수 있으며 조건부확률 공식을 이용해 풀어쓰면 위와 같아진다. 그리고 이전 포스팅에서 소개했던 예시를 똑같이 들어 Joint 확률 표를 작성한다.
그리고 우리가 구하려고하는 Py|x(1|0)을 구할 때 Joint확률 표를 이용해서 계산하게 되면 1/2이라는 값이 나오게 된다.
다음은 확률변수가 연속확률변수(Continuous)일 때를 알아보자.
Uniform Distribution일때인 원의 경우를 이용해서 구해보자. 위 그림과 같이 조건부확률의 식을 계산하게 되면 위와 같아진다.
이제 연속확률변수의 연합확률분포의 PDF를 구하기 위해 CDF와의 미분관계를 이용하여 계산을 해보자.
왼쪽식과 같이 전개되면서 P(X=x)일 때 0이 되기 때문에 0/0 이라는 값이 나오게 된다. 따라서 델타x라는 값이 점점 0으로 수렴해가는 극한값을 이용하게 되고 CDF(F(x))함수를 이용하게 되면 결국 CDF를 미분한 값이 PDF라는 값이 나오게 된다.
따라서 위 그림속의 So 부분을 보면 연속확률변수일 때의 조건부확률분포 PDF에 대한 식이 되게 된다. 또한 만약 두 개의 확률변수 x,y가 서로 독립적이라면 오른쪽 식과 같은 등식이 성립된다.
위 그림에서 그래프가 다음과 같을 때 다중변수의 조건부확률의 평균값은 위와 같아진다. 만약 Continuous한 확률변수일 때는 -무한대 ~ +무한대까지의 PDF와 확률변수 y값을 곱해준 식을 적분해주면 된다.
분산을 구하기 위해서는 위 식에서 y를 y제곱으로 바꾸어주고 평균의 제곱값을 빼주면 분산값이 된다. 이에 대한 계산과정은 그동안 쭉해왔던 분산을 구하는 계산과정이므로 생략하겠다.
'Data Science > 확률 및 통계' 카테고리의 다른 글
확률변수의 함수(Functions of Random Variables) (0) | 2020.03.26 |
---|---|
조건부평균과 공분산(Covariance)과 상관계수 (0) | 2020.03.24 |
다중변수(Multiple RV)와 연합분포 (0) | 2020.03.22 |
정규분포(Gaussian Distribution)의 정의와 활용 (0) | 2020.03.21 |
지수분포(Exponential)와 어랑분포(Erlang) (0) | 2020.03.20 |