본문 바로가기

Data Science/확률 및 통계

연합확률밀도함수와 조건부 확률밀도함수

반응형

이번 포스팅에서는 다중확률변수에 기반한 연합확률밀도함수조건부 확률밀도함수에 대해서 소개해보려고 한다.

 

1.연합확률밀도함수

 

연합확률밀도함수

저번 포스팅에 이어서 다중연속확률변수일 때의 확률밀도함수를 구하는 걸 복습겸 이어서 소개해보겠다.

포인트는 x,y라는 두 개의 확률변수로 이중적분, 이중미분을 한다는 것이다. 

 

다음으로는 y=x라는 직선그래프의 예시와 원 그래프의 경우 두 가지로 살펴보자. 단 원 그래프 일때는 모든 구간의 확률이 일정한 Uniform Distribution이다. 각 두개의 그래프에서 x,y 특정 구간에 대해서 CDF함수를 구하는 것은 위 그림과 같다.

 

2. 조건부 확률분포

이번엔 조건부확률일 때의 확률분포에 대해서 알아보자. 기존처럼 확률변수가 Discrete, Continuous일 때 각각의 Case별로 알아보자.

먼저 집합의 개념에서 조건부 확률에서 확률(PDF), CDF로 바꾸는 수식을 밑의 그림을 통해 다시 복습하자.

 

조건부확률 분포

조건부확률분포를 Discrete(이산확률변수)일 때 살펴보자. 예시를 저번 포스팅에서 들었던 동전의 예시로 살펴보자.

 

이산확률변수일 때의 조건부확률분포

다중변수의 조건부확률에 대한 식은 위의 Pxy(Y=y|X=x)로 나타낼 수 있으며 조건부확률 공식을 이용해 풀어쓰면 위와 같아진다. 그리고 이전 포스팅에서 소개했던 예시를 똑같이 들어 Joint 확률 표를 작성한다. 

그리고 우리가 구하려고하는 Py|x(1|0)을 구할 때 Joint확률 표를 이용해서 계산하게 되면 1/2이라는 값이 나오게 된다.

 

다음은 확률변수가 연속확률변수(Continuous)일 때를 알아보자.

 

연속확률변수의 조건부확률분포 

Uniform Distribution일때인 원의 경우를 이용해서 구해보자. 위 그림과 같이 조건부확률의 식을 계산하게 되면 위와 같아진다.

 

이제 연속확률변수의 연합확률분포의 PDF를 구하기 위해 CDF와의 미분관계를 이용하여 계산을 해보자.

왼쪽식과 같이 전개되면서 P(X=x)일 때 0이 되기 때문에 0/0 이라는 값이 나오게 된다. 따라서 델타x라는 값이 점점 0으로 수렴해가는 극한값을 이용하게 되고 CDF(F(x))함수를 이용하게 되면 결국 CDF를 미분한 값이 PDF라는 값이 나오게 된다.

 

연속확률변수의 연합확률분포

따라서 위 그림속의 So 부분을 보면 연속확률변수일 때의 조건부확률분포 PDF에 대한 식이 되게 된다. 또한 만약 두 개의 확률변수 x,y가 서로 독립적이라면 오른쪽 식과 같은 등식이 성립된다.

 

다중변수의 조건부확률의 평균과 분산

위 그림에서 그래프가 다음과 같을 때 다중변수의 조건부확률의 평균값은 위와 같아진다. 만약 Continuous한 확률변수일 때는 -무한대 ~ +무한대까지의 PDF와 확률변수 y값을 곱해준 식을 적분해주면 된다.

 

분산을 구하기 위해서는 위 식에서 y를 y제곱으로 바꾸어주고 평균의 제곱값을 빼주면 분산값이 된다. 이에 대한 계산과정은 그동안 쭉해왔던 분산을 구하는 계산과정이므로 생략하겠다.

 

반응형