본문 바로가기

Data Science/확률 및 통계

확률변수의 함수(Functions of Random Variables)

반응형

이번 포스팅에서는 두 개의 확률변수를 다루지만 확률변수 Y가 X에 대한 함수로 이루어진 확률변수의 함수에 대해서 다루어보려고 한다. 그리고 확률변수의 함수일 때 평균값을 구하는 방법도 알아보자.

 

1. 확률변수의 함수

 

확률변수의 함수

X에 관련된 함수로 정의된 Y=g(X) 라는 함수의 종류에 따라 확률변수 X와의 확률분포와 같을 수도 다를수도 있다. 위 그림에서 오른쪽 예시를 통해 살펴보자. 

 

파란색 1번에서는 Y=2X+1 이라는 일종의 g(X)함수가 주어졌다. 이 때는 확률변수 Y값에 따른 확률이 확률변수 X일 때와 모두 같다. 따라서 확률변수 Y=2X+1 의 확률분포 그림은 확률변수 X의 확률분포와 같을 것이다.

하지만 빨간색 2번에서는 Y=X제곱이라는 함수가 주어졌고 확률변수 Y에 대한 확률값은 각각 1/2, 1/2로 나오게 된다. 따라서 빨간색의 함수일 때는 기존의 확률변수 X일 때의 확률분포와 다른 형태로 그려질 것이다.

 

그렇다면 이제 함수의 종류에 따라, 그리고 함수의 종류가 뭐든지 간에 일반화한 Case를 각각 다루어 보겠다.

 

1. Linear Function(직선 그래프) 일 때

확률변수의 함수가 직선 그래프일 때

Y=g(X)함수를 aX+b 라는 직선그래프로 정의해보자. 참고로 fx(x)라는 확률변수 X에 대한 PDF 함수는 주어져 있음을 전제한다. 이 때 확률변수 Y에 대한 PDF 함수를 어떻게 정의할까?

 

우선 확률변수 Y에 대한 PDF를 정의하기 위해서 CDF --미분--> PDF 공식을 이용한다. 따라서 Fy(y) 함수를 정의하게 되면 P(aX+b =< y) 에 대한 식이 된다. 이 때 우리는 a가 0보다클 때와 작을 때로 Case 분류를 해서 우선 정의를 해본다.

 

오른쪽 그림처럼 각 Case에 따라 분류를 해주고 중간에 y값에 대해 미분을 하게 되면 각각 Case에 따라 y에 대한 PDF함수( fy(Y) )가 정의가 된다. 이 두개의 식을 합치면 결국 빨간색 네모칸으로 쳐진 부분이 된다.(각 Case의 결과값에 대한 차이는 양수 a인지 음수 a인지의 차이일 뿐이기 때문이다.)

 

그리고 직관적으로 알아보기 위해 1,2번 그래프에 대한 그림들을 각자 그려보자. 그래프 속 분홍색으로 칠해진 부분이 바로 각 Case에 따른 확률변수 y에 대한 PDF값이다.(즉, fy(y) )

 

2. 근이 2개인 2차함수일 때

확률변수의 함수가 2차함수 일때

이번엔 Y=X제곱이라는 g(X)함수가 정의되었을 때를 살펴보자. 과정은 위에서 한 것처럼 확률변수 Y에 대한 PDF를 구하기 위해서 CDF를 이용해서 미분과정을 하면 된다. 계산 후 빨간섹 네모칸에 적혀있는 식이 바로 확률변수 Y에 대한 PDF값이 되게 된다.

 

이 예시 또한 시각적으로 보기 위해 그래프를 그려보자. 분홍색으로 칠해진 부분이 바로 확률변수 Y에 대한 PDF라고 보면 된다. 그 때의 X값들은 -루트y, +루트y 값이 된다. 

 

3. 일반화된 공식

3차 함수를 예시로 들면서 확률변수의 함수의 일반화 공식을 유도해보자. 밑의 그림과 같이 그려지는 3차 함수 Y=g(x)가 존재하며 y는 극댓값과 극솟값 사이에 있다. 이 때 P(Y=<y)에 대한 PDF식을 구해보자. 

 

확률변수의 함수를 일반화한 공식

먼저 PDF를 구해주기 위해서 CDF함수의 미분을 이용한다. 위의 계산과정을 따라가다 보면 2가지에 주의해야 하는데 

첫 번째는 미분과정에서 Chain Rule을 사용하는 것이다. 즉, 위 계산과정을 예시로 들면 y에 대한 미분이 써져 있지만 x에 대한 미분을 하기 위해서 x에 대한 미분을 추가후 dx/dy를 다시 한 번 곱해주는 것이다.

두 번째는 첫 번째 단계로 도출된 결과값을 파란색 네모칸 안에 있는 도함수의 역함수를 이용해서 계산을 해준다.

 

따라서 최종적인 계산이 나오는데. 분홍색 밑줄로 칠해진 g'(x2) 함수는 그래프를 보면 분홍색으로 칠해진 감소 하는 기울기가 음수인 그래프므로 최종적인 계산값에서 모두 양수로 나오게 된다.

 

이렇게 계산함으로써 일반화 공식을 만들기 위해 시그마를 이용해서 나타낼 수 있다. 단, 분모에는 절댓값을 넣어주는 걸 잊지말자! 

 

4. 확률변수의 함수의 평균값

 

이번엔 특정 함수로 주어진 확률변수 함수의 평균값을 구해보자. 

하지만 이러한 경우의 평균값을 구할 때 굳이 우리가 이번 포스팅에서 해왔던 확률변수 Y에 대한 PDF를 구하기 위해 CDF를 미분하고 하는 과정을 수고스럽게 할 필요가 없다.

 

평균값을 구할 때는 굳이 Y에 대한 PDF함수를 구할 필요가 없다.

그렇다면 뭘 해야 할까? 우리가 기존에 다루었던 E[g(X)] = 라고 적혀있는 방법을 이용하면 된다. 또한 분산값을 구하기 위해서 E[X제곱] 값을 구할 때도 마찬가지다. 

(기존에 다루었던 방법에 대한 포스팅 링크에서 1.다중변수일 때 조건부평균  부분을 보면 됩니다.  : https://techblog-history-younghunjo1.tistory.com/50?category=888548

 

조건부평균과 공분산(Covariance)과 상관계수

이번 포스팅에서는 조건부평균과 공분산에 대해서 소개하려고 한다. 저번 포스팅에서 소개했던 다중변수에서 조건부 확률분포와 밀도함수에 대해서 알아보았다. 그 내용의 연장선으로 변수가 2개일 때 조건부확률..

techblog-history-younghunjo1.tistory.com

 

반응형