본문 바로가기

Data Science/확률 및 통계

두 확률변수로 만드는 또다른 두개의 확률변수

반응형

이전 포스팅에서는 이산확률변수 두 개가 합해져 만들어지는 새로운 확률변수를 Convolution을 이용해 계산하는 내용에 대해서 알아보았다. 이번 포스팅에서는 X,Y 라는 두 확률변수가 Z,W 라는 또 다른 두 개의 확률변수를 만드는 방법에 대해서 설명하려고 한다. 텍스트로만으로는 이해가 안 될 수도 있을 것 같아 필기로 표시해보았다.

 

1. 공식

두 확률변수로 또 다른 두개의 확률변수를 만들어보자.

위 그림 처럼 X,Y라는 기존의 확률변수들로 Z,W라는 새로운 확률변수를 만들려고 한다. 이 때 우리는 역함수 관계Joint 확률, 그리고 자코비안(J) 행렬이라는 개념을 이용해야 한다. 

역함수관계와 Joint 확률에 대해서는 그동안 다뤄왔던 내용이기 때문에 따로 설명은 안하지만 자코비안 행렬에 대한 개념에 대해서는 설명해보려고 한다. 

 

우선 그림을 예시로 보면서 해보자. 자코비안은 해당 문자에 대해서 한번씩 편미분을 해준 값을 행렬로 나열하고 대각선끼리 곱해서 빼주는 것을 말한다. J = 라고 적혀있는 계산 방법을 보면 알 수 있을 것이다.

 

이제 새롭게 구하려는 Z,W라는 두 개의 확률변수의 Joint 확률을 구하기 위해서는 X,Y의 Joint확률을 이용해야 하고 공식은 빨간색글씨로 그려진 fxy(X,Y) / | J | 처럼 나오게 된다.

 

이번엔 간단한 예시를 통해서 공식을 적용해보자.

 

자코비안을 이용한 공식 사용 예시

U=X+Y, V=X-Y 라는 두개의 확률변수 일 때 fuv(U,V)의 확률을 구하기 위해서 위와 같은 계산을 전개해나가면 된다.

참고로 U=X+Y, V=X-Y이 두 개의 시긍로부터 X=,Y= 값을 U,V와 관련된 식으로 변환해줄 수 있고 이를 최종 결과 값의 fxy(X,Y)의 X,Y에 대입을 해주어 fuv(U,V)식을 U,V와 관련된 식으로 만들면 된다.

 

2. 두 개의 확률변수로 하나의 확률변수를 만들기

우리가 이전 포스팅에서 배웠다고 한 연속, 이산 확률변수일 때의 합으로 이루어진 새로운 확률변수를 구했던 경우도

"두 개의 확률변수" - > "하나의 확률변수" 의 과정이랑 똑같다. 하지만 항상 새로운 확률변수가 기존의 두 개의 확률변수의 합으로만 이루어지는 것이 아니다. 게다가 Convolution이라는 연산은 두 개의 확률변수의 '합' 일 때만 적용이 가능하기 때문에 한계가 발생한다.

 

새로운 확률변수가 두 개의 확률변수의 합으로 이루어진 게 아니라면?

그렇다면 이러한 상황일 때는 어떻게 해주어야 할까? 바로 auxiliary Random Variable을 정의해주어야 한다. 한국어로는 임시적인 확률변수를 정의해준다. 이 때 임시적인 확률변수는 복잡한 것이 아닌 우리가 기존의 확률변수라고 말했던 X,Y 둘 중 하나로 정의를 해준다. 

 

위 그림에서는 Z에 대한 확률변수를 구해주기 위해 임시적인 확률변수 W를 추가해 준다. 

그리고 fzw(Z,W) 을 W에 관해서 무한대 범위로 적분을 해주면 Marginal Density가 되기 때문에 결국 fz(Z) (Z에 관한 확률변수)로 변환되게 된다.

 

오른쪽 예시를 이해하기 편하게 필기해놓았다. 해당 부분을 읽고 천천히 이해해보자.

 

 3. 새로운 확률변수를 만들어주는 함수(g(x))를 구하기

이번에는 기존의 확률변수 X가 어떤 함수(g(x))에 의해서 Y라는 새로운 확률변수 함수가 나오게 됬다고 하자. 즉, 기존의 확률변수 X와 새로운 확률변수 Y에 대한 PDF, CDF 함수를 모두 알고 있는 상황이다. 이 때 우리는 X를 Y로 만들어주는 함수(g(x))를 어떻게 구할 수 있을까?

 

g(x)함수를 구하는 방법

우선 확률변수 X,Y의 각각 PDF, CDF 함수를 알고 있으므로 왼쪽과 같이 적어두자. 그리고 g(x)라는 함수를 단조감수 함수로 가정하고 그래프를 그려본다. 그리고 우리가 전제로 알고 있던 확률변수 Y에 대한 CDF 함수을 알고 있으므로

그것을 이용해 계산해본다.

 

오른쪽 Fy(y) = 식을 보면 "x=g(y)의역함수" 관계를 이용해서 초록색 네모칸이 쳐진 식과 같이 나오게 된다. 그리고 우리가 확률변수 X에 대한 CDF함수인 "Fx(x) = x" 라는 것을 알고 있기 때문에 이를 이용해 "Fx(g(y)의역함수) = g(y)의역함수" 라는 계산값이 나오게 된다. 

 

이렇게 나온 결과 값이 우리가 전제해서 알고 있다고 했던 Fy(y) = 값 과 동일하기 때문에(분홍색 네모칸) 결국 y= -logx 라는 y=g(x)= 로그함수 라고 g(x)함수의 정체를 알 수가 있다.

 

강의 말미에서는 교수님께서 이러한 위의 방식들이 어떤 현실에 적용되는지 알려주시는 시간이 있었다. 

우리가 배웠던 포아송분포톨게이트나 은행 창구와 같은 특정 시간구간동안 얼마나 많은 이벤트(사건)이 발생하는지를 알기 위해 사용하는데 우리는 포아송분포를 모델링 하기 위해서 다음과 같은 단계를 거치면 된다.

 

  1. Uniform Distribution으로  Random한 숫자들을 구한다.
  2. 1번에서 구한 Random한 숫자를 위 예시에서 구했던 -logx값에 넣어서 y값을 구해준다. 그리고 그 y값들은 시간구간이며 exponential하게 된다. 즉, y값의 시간간격마다 event가 발생한다는 것이다.
  3. 따라서 이렇게 구한 시간간격을 이용해 1시간, 하루, 한달의 전체 기간을 설정해서 Count하게 되면 포아송분포로 모델링을 할 수 있는 것이다.
반응형