본문 바로가기

Data Science/선형대수

Inverse Matrix(역행렬)&Transpose Matrix(전치행렬)

반응형

이번 포스팅에서는 역행렬과 전치행렬의 정의와 특성에 대해서 알아보려고 한다. 먼저 역행렬의 정의와 여러가지 특성에 대해서 알아보자. 

 

1. Inverse Matrix (역행렬)

 

역행렬의 정의와 특성

 

우선 역행렬이 존재하려면 반드시 정방행렬(m by m)(Square Matrix)이어야 한다. 하지만 정방행렬이라고 해서 모든 행렬이 역행렬을 갖고 있는 것은 아니다. 특정 행렬 A의 Determinant가 0이 아닐 때만 역행렬이 존재한다. 결론부터 말하자면 여기서 Determinant란 우리가 가우스 소거법 포스팅에서 배웠던 Diagonal element(행렬의 대각요소들)인 Pivot값들을 말한다. 즉, Pivot값이 모두 Non-zero값이 되어야 역행렬을 가질 수 있다는 의미이다.

 

이제 역행렬의 특징에 대해서 알아보자.

  • 방금 언급했던 것처럼 n개의 non-zero값인 pivots값들을 만들어낼 때 역행렬이 존재한다.

  • 역행렬은 Unique 해야 한다. 즉, 하나의 역행렬만 갖고 있어야 한다.

  • 만약 역행렬이 존재한다면 Ax=b 라는 선형 시스템에서 x(input)과 b(output)은 1:1 대응이다.

역행렬의 추가적인 특징을 알아보자. 다음 그림을 보고 설명하려 한다.

 

역행렬의 특징

 

  • Ax = 0 (b가 0임) 과 같은 non-zero값의 벡터가 존재할 때 X=0이라는 것은 Solution을 제공하지만 Trivial Solution이다. 즉, X=0 이라는 것은 input값이 아무것도 없다는 것을 의미하기 때문이다. 또한 Ax=0이라는 벡터의 경우에는 A라는 행렬의 역행렬이 존재해서는 안 된다.

  • 2 by 2 행렬에서의 Determinant 조건은 'ad-bc = 0이 아닐 때' 이다.

  • Diagonal Matrix의 역행렬을 취하면 Diagonal element의 역수를 취해주면 된다.

  • 역행렬을 여려개 곱하면 Reverse order(반대 순서)로 나열이 된다.

1-2. Gauss-Jordan Method

다음은 기존에 배웠던 가우스 소거법을 통해서 미지수를 구했던 것처럼 또 한 번의 추가적인 가우스 소거법을 이용해 임의의 행렬 A의 역행렬을 구하는 Gauss-Jordan Method에 대해서 알아보려고 한다. 이는 일반화된 정의가 매우 이해하기 난해하므로 예시 문제 그림을 통해서 이해해보자. 포인트는 가우스 소거법을 1차적으로 진행한 후 U행렬을 I(항등원 행렬)로 만들어 주기 위해서 Upper traingle부분을 0으로 만들어주는 것과 Diagonal element를 1값으로 만들기 위해 각 Diagonal element를 나누어주는 것이다.

 

Gauss-Jordan Method 예시

 

2. Transpose Matrix (전치행렬)

다음은 전치행렬에 대한 내용이다. 전치행렬은 역행렬과 달리 정방행렬뿐만 아니라 직각행렬일 때도 전치행렬을 구할 수 있다. 전치행렬이란 임의의 행렬 A에 전치행렬을 취해주었을 때 기존 행렬 A의 행,열값을 열,행값으로 바꿔주는 것이다. 밑의 그림을 보면서 전치행렬이 어떤식으로 이루어지는지 그리고 전치행렬의 특성에 대해서 알아보자.(*표로 표기된 부분이 전치행렬의 특성)

 

전치행렬의 정의와 특성

 

2-1. Symmetric Matrix(대칭행렬)

다음은 전치행렬의 종류 중 특이한 행렬에 해당하는 대칭행렬에 대한 내용이다. 실제적으로 주변에서 흔히 볼 수 있는 전치행렬의 종류이다. 대칭행렬이란, 임의의 행렬 A와 행렬A의 Transpose취한 행렬이 서로 같은 것이다. 그러므로 A행렬의 1행의 값과 A^T행렬의 1열의 값은 같은 셈이다. 하지만 이러한 조건을 만족하기 위해서는 반드시 정방행렬이어야 한다는 점을 잊지말자.

 

대칭행렬의 정의와 특성

 

2-2. Correlation Matrix

상호 상관 행렬이라고도 부르며 이 행렬 또한 대칭행렬에 속하기도 한다. Correlation Matrix는 머신러닝 수업에서 배웠던 Covariance Matrix(공분산 행렬)과 연결되기도 하며 향후 고유값, 고유벡터를 구할 때와 관련이 있다고 한다. 

 

Correlation Matrix

 

Correlation Matrix는 위와 같이 서로의 행,열끼리 서로 곱해주고 결국 각 쌍의 Column Vector의 내적(inner product)으로 나타낼 수 있다. 이러한 내적의 의미는 결국 '특정 X1이라는 벡터가 X2, X3...Xn의 벡터들 각각의 성분을 얼마나 가지고 있는지, 얼마나 상관성이 있는지'를 뜻하기도 한다. 이를 용어로 Projection이라고도 한다. 

반응형