๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

Data Science/Machine Learning

[ML] Partial Least Squares(๋ถ€๋ถ„ ์ตœ์†Œ์ œ๊ณฑ๋ฒ•)

๋ฐ˜์‘ํ˜•

๐Ÿ”‰ํ•ด๋‹น ํฌ์ŠคํŒ…์—์„œ ์‚ฌ์šฉ๋œ ์ž๋ฃŒ๋Š” ๊ณ ๋ ค๋Œ€ํ•™๊ต ์‚ฐ์—…๊ฒฝ์˜๊ณตํ•™๋ถ€ ๊น€์„ฑ๋ฒ”๊ต์ˆ˜๋‹˜์˜ Youtube ๊ฐ•์˜์ž๋ฃŒ์— ๊ธฐ๋ฐ˜ํ–ˆ์Œ์„ ์•Œ๋ ค๋“œ๋ฆฝ๋‹ˆ๋‹ค. ํ˜น์—ฌ๋‚˜ ์ถœ์ฒ˜๋ฅผ ๋ฐํ˜”์Œ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์ €์ž‘๊ถŒ์˜ ๋ฌธ์ œ๊ฐ€ ๋œ๋‹ค๋ฉด joyh951021@gmail.com์œผ๋กœ ์—ฐ๋ฝ์ฃผ์‹œ๋ฉด ํ•ด๋‹น ์ž๋ฃŒ๋ฅผ ์‚ญ์ œํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค.(์ €์ž‘๊ถŒ์˜ ๋ฌธ์ œ๊ฐ€ ๋˜์ง€ ์•Š๋„๋ก ์‚ฌ์ง„์€ ์ตœ๋Œ€ํ•œ ์ œ๊ฐ€ ์ง์ ‘ ๋งŒ๋“  ์ž๋ฃŒ๋กœ ๋Œ€์ฒดํ–ˆ์Šต๋‹ˆ๋‹ค :) )

 

์ด๋ฒˆ ํฌ์ŠคํŒ…์—์„œ๋Š” Feature Extraction์˜ ๋ฐฉ๋ฒ• ์ค‘ ํ•˜๋‚˜์ธ Parital Least Squares(๋ถ€๋ถ„ ์ตœ์†Œ์ œ๊ณฑ๋ฒ•)์— ๋Œ€ํ•ด ์•Œ์•„๋ณด๋ ค๊ณ  ํ•œ๋‹ค. ๋ถ€๋ถ„ ์ตœ์†Œ์ œ๊ณฑ๋ฒ•์€ Feature Extraction ๋ฐฉ๋ฒ• ์ค‘์—์„œ๋„ Supervisedํ•œ ๋ฐฉ๋ฒ•์— ์†ํ•œ๋‹ค. ์•„๋‹ˆ Feature Extraction์—์„œ๋„ Supervised์™€ Unsupervised๊ฐ€ ๋‚˜๋ˆ„์–ด์ ธ ์žˆ๋Š” ๊ฑด๊ฐ€? ๊ฒฐ๋ก ๋ถ€ํ„ฐ ๋งํ•˜๋ฉด ๋งž๋‹ค.

 

๋”ฐ๋ผ์„œ ๋ถ€๋ถ„ ์ตœ์†Œ์ œ๊ณฑ๋ฒ•์„ ์†Œ๊ฐœํ•˜๊ธฐ ์ด์ „์— Feature Selection๊ณผ Feature Extraction์˜ ์ฐจ์ด๊ฐ€ ๋ฌด์—‡์ธ์ง€, ๊ทธ๋ฆฌ๊ณ  ๊ฐ๊ฐ์˜ ๋ฐฉ๋ฒ•์—์„œ๋„ Supervised, Unsupervisedํ•œ ๋ฐฉ๋ฒ•์˜ ์ฐจ์ด๊ฐ€ ๋ฌด์—‡์ธ์ง€ ์•Œ์•„๋ณด์ž.

 

PLS๋Š” ์ฐจ์›์ถ•์†Œ์˜ ๋ฐฉ๋ฒ• ์ค‘ ํ•˜๋‚˜์ด๋‹ค.

 

๋จผ์ € Feature Extraction๊ณผ Feature Selection์˜ ์ฐจ์ด์ ์€ ๋ฌด์—‡์ผ๊นŒ? ์šฐ์„  ํ•œ๊ตญ์–ด๋กœ ํ•ด์„ํ•˜์ž๋ฉด '์ถ”์ถœ'๊ณผ '์„ ํƒ'์˜ ์˜๋ฏธ์  ์ฐจ์ด๊ฐ€ ์žˆ๋‹ค. ์ข€ ๋” ๋ฐ์ดํ„ฐ ์ฐจ์›์—์„œ ์˜๋ฏธ๋ฅผ ํ™•์žฅํ•ด๋ณธ๋‹ค๋ฉด '์ถ”์ถœ'์€ ๊ธฐ์กด์˜ ๊ฒƒ๋“ค์„ ๋ฌด์—‡์ธ๊ฐ€ ๋ณ€ํ˜•์„ ์ทจํ•ด ์ƒˆ๋กœ์šด ๊ฒƒ์„ ๋งŒ๋“ค์–ด๋‚ด๋Š” ์˜๋ฏธ์ธ ๋ฐ˜๋ฉด '์„ ํƒ'์€ ๊ธฐ์กด์˜ ๊ฒƒ๋“ค์„ ๊ทธ๋Œ€๋กœ ๋‘” ์ฑ„ ํ•˜๋‚˜(๋˜๋Š” ๊ทธ ์ด์ƒ)๋ฅผ ์„ ํƒํ•˜๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค. ๋‘ ๊ฐœ์˜ ์ฐจ์ด๋ฅผ ๊ทธ๋ฆผ์œผ๋กœ ํ™•์ธํ•ด๋ณด๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

 

Feature Extraction VS Feature Selection

 

์ด์ œ ๋‘ ๊ฐ€์ง€์˜ ์ฐจ์ด์ ์„ ์•Œ์•˜์œผ๋‹ˆ ๊ฐ ๋ฐฉ๋ฒ•์— ์žˆ์–ด์„œ Supervised์™€ Unsupervised์˜ ์ฐจ์ด์ ์€ ๋ฌด์—‡์ผ๊นŒ? ๋ฐ”๋กœ ์ข…์†๋ณ€์ˆ˜ ์ฆ‰, Y๊ฐ’์„ ๊ณ ๋ คํ•˜์—ฌ ๋ณ€์ˆ˜๋ฅผ ์ถ”์ถœ(๋˜๋Š” ์„ ํƒ)ํ•˜๋Š”์ง€ ์—ฌ๋ถ€์ด๋‹ค. ์šฐ๋ฆฌ๊ฐ€ ์ด์ „์— ๋จธ์‹ ๋Ÿฌ๋‹์˜ ๊ธฐ๋ณธ ๋ชจ๋ธ ์ข…๋ฅ˜๋ฅผ ๋ฐฐ์šธ ๋•Œ ์ง€๋„(Supervised) ํ•™์Šต, ๋น„์ง€๋„(Unsupervised) ํ•™์Šต์œผ๋กœ ๋‚˜๋ˆ„์–ด ๋ฐฐ์šด ๊ฒƒ์ฒ˜๋Ÿผ Feature Extraction๊ณผ Feature Selection ์—์„œ๋„ ๋™์ผํ•˜๋‹ค. ๊ฐ ๋ฐฉ๋ฒ•๋“ค์˜ ์ž์„ธํ•œ ๊ธฐ๋ฒ• ์ •๋ณด๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

 

์ฐจ์› ์ถ•์†Œ๋ฐฉ๋ฒ•์˜ ๋Œ€ํ‘œ์ ์ธ ์ข…๋ฅ˜๋“ค

 

์ด์ œ ์šฐ๋ฆฌ๊ฐ€ ์ค‘์ ์ ์œผ๋กœ ๋‹ค๋ฃฐ ์ฃผ์ œ๋Š” ์œ„ ๊ทธ๋ฆผ์˜ ๊ฐ€์žฅ ์™ผ์ชฝ์— ์žˆ๋Š” PLS์ธ ๋ถ€๋ถ„ ์ตœ์†Œ์ œ๊ณฑ๋ฒ•์ด๋‹ค. PLS๋Š” Supervisedํ•œ ๋ฐฉ๋ฒ•์œผ๋กœ์„œ Y๊ฐ’์„ ๊ณ ๋ คํ•ด์„œ ์ฐจ์›์„ ์ถ•์†Œํ•˜๊ฒŒ ๋œ๋‹ค. ์ด ๋•Œ Y๊ฐ’์„ ๊ณ ๋ คํ•œ๋‹ค๋ผ๋Š” ๊ฒƒ์€ Y๊ฐ’์˜ ๋ถ„์‚ฐ์„ ํ™œ์šฉํ•˜๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค. ๋”ฐ๋ผ์„œ PLS๋Š” X๋ผ๋Š” ๋…๋ฆฝ๋ณ€์ˆ˜๋“ค์˜ ์„ ํ˜•๊ฒฐํ•ฉ๊ณผ Y๋ผ๋Š” ์ข…์†๋ณ€์ˆ˜ ์ด 2๊ฐœ ๊ฐ„์˜ ๊ณต๋ถ„์‚ฐ์„ ์ตœ๋Œ€ํ™”ํ•˜๋Š” ์ƒˆ๋กœ์šด ๋ณ€์ˆ˜๋กœ ์ถ”์ถœ(Extraction)ํ•˜๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค.

 

PLS๋ฅผ PCA์™€ ๋น„๊ตํ•ด ์„ค๋ช…ํ•œ๋‹ค๊ณ  ํ•˜๋ฉด, PCA์™€ ๊ฐ™์€ $X$๋ณ€์ˆ˜๋“ค ๊ฐ„์˜ ์ผ๋ฐ˜์ ์ธ ์„ ํ˜•๊ฒฐํ•ฉ์œผ๋กœ ์ถ”์ถœ๋œ ์ƒˆ๋กœ์šด ๋ณ€์ˆ˜๊ฐ€ ์„ค๋ช…ํ•˜์ง€ ๋ชปํ•˜๋Š” ๋ถ€๋ถ„์— ๋ฐ˜๋ณต์ ์ธ ์ตœ์†Œ์ œ๊ณฑ๋ฒ•์„ ํ™œ์šฉํ•˜๋Š” ๊ฒƒ์ด PLS์ด๋‹ค. ์ด๋ ‡๊ฒŒ ๋ง๋กœ๋งŒ ํ•œ๋‹ค๋ฉด ์ œ๋Œ€๋กœ ์ดํ•ด๊ฐ€ ๋˜์ง€ ์•Š์„ ๊ฒƒ์ด๋‹ค. ๋ช‡ ๊ฐ€์ง€ ์ˆ˜์‹์„ ์‚ดํŽด๋ณด๋ฉด์„œ ์ดํ•ดํ•ด๋ณด์ž.

 

์šฐ์„  $X$๋Š” ์ž…๋ ฅ๋ณ€์ˆ˜, $Y$๋Š” ์ถœ๋ ฅ๋ณ€์ˆ˜, $t$๋Š” PCA ์ˆ˜ํ–‰ํ•  ๋•Œ์™€ ๋™์ผํ•œ ์ผ๋ฐ˜์ ์ธ $X$์˜ ์„ ํ˜•๊ฒฐํ•ฉ, $w$๋Š” ์„ ํ˜•๊ฒฐํ•ฉ์˜ ๊ณ„์ˆ˜(๊ฐ€์ค‘์น˜)๋ฅผ ์˜๋ฏธํ•œ๋‹ค. ์ด ๋•Œ ์ผ๋ฐ˜์ ์ธ $X$์˜ ์„ ํ˜• ๊ฒฐํ•ฉ์œผ๋กœ ์ธํ•ด ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์‹์„ ๋งŒ์กฑํ•œ๋‹ค.

 

$$t = Xw$$

 

์ด์ œ $X$์˜ ์„ ํ˜•๊ฒฐํ•ฉ์ธ $t$์™€ ์ข…์†๋ณ€์ˆ˜์ธ $Y$๊ฐ„์˜ ๊ณต๋ถ„์‚ฐ์„ ๊ณ„์‚ฐํ•ด๋ณด์ž. ๊ณ„์‚ฐํ•˜๊ธฐ ์œ„ํ•ด ์ผ์‹œ์ ์ธ ๊ณ„์‚ฐ ํŠธ๋ฆญ์„ ์‚ฌ์šฉํ•  ๊ฒƒ์ด๋‹ค. ๋ฐ”๋กœ ์šฐ๋ณ€์— $t$์™€ $Y$์˜ ๊ฐ ํ‘œ์ค€ํŽธ์ฐจ๋กœ ๋‚˜๋ˆ„์–ด์ฃผ๊ณ  ๋‹ค์‹œ ๊ณฑํ•ด์ค€๋‹ค. 

 

$$Cov(t, Y) = {Cov(t, Y)\over\sqrt{Var(t)}\sqrt{Var(Y)}}\sqrt{Var(t)}\sqrt{Var(Y)}$$

 

์ด ๋•Œ ์œ„ ๊ณต์‹์„ ์ž˜ ์‚ดํŽด๋ณด๋ฉด $t$์™€ $Y$๊ฐ„์˜ ์ƒ๊ด€๊ด€๊ณ„(Correlation) ๊ณต์‹์ด ์ˆจ์–ด์žˆ์Œ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค. ๋”ฐ๋ผ์„œ ์‹์€ ๋‹ค์Œ๊ณผ ๊ฐ™์•„์ง„๋‹ค.

 

$$Cov(t, Y) = Corr(t, Y)\sqrt{Var(t)}\sqrt{Var(Y)}$$

 

๋”ฐ๋ผ์„œ $\max [Cov(t, Y)]$๋Š” $\max [Corr(t, Y)Var(t)]$์™€ ๋™์ผํ•˜๊ฒŒ ๋œ๋‹ค. $Y$๊ฐ’์€ ์ด๋ฏธ ์ฃผ์–ด์ ธ ์žˆ๋Š” ๊ฐ’์ด๊ธฐ ๋•Œ๋ฌธ์— $Var(Y)$๋ฅผ ์ตœ๋Œ€ํ™”ํ•  ์ˆ˜ ์—†๋‹ค. ๋”ฐ๋ผ์„œ ์šฐ๋ฆฌ๊ฐ€ ํ•  ์ˆ˜ ์žˆ๋Š” ๋ถ€๋ถ„์€ ์„ ํ˜•๊ฒฐํ•ฉ์ธ $t$์˜ ๋ถ„์‚ฐ์ธ $Var(t)$์™€ $Corr(t, Y)$์˜ ๊ณฑ์„ ์ตœ๋Œ€ํ™”ํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

 

์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” ์กฐ๊ฑด(์ตœ๋Œ€ํ™”)์„ ๋งŒ์กฑ์‹œํ‚ค๊ธฐ ์œ„ํ•ด์„œ๋Š” $t$๋ฅผ ์•Œ์•„์•ผ ํ•œ๋‹ค. ๊ทธ๋Ÿฐ๋ฐ $t = Xw$์ด๊ธฐ ๋•Œ๋ฌธ์— $w$๊ฐ’์„ ์•Œ๊ฒŒ๋˜๋ฉด $t$๊ฐ’๋„ ์ž๋™์œผ๋กœ ์•Œ๊ฒŒ ๋œ๋‹ค. ์šฐ์„  $t$์—๋‹ค๊ฐ€ $Xw$๋ฅผ ๋Œ€์ž…ํ•ด์„œ $\max Cov(Xw, Y)$๋ฅผ ๊ณ„์‚ฐํ•ด๋ณด์ž.

 

$$Cov(Xw, Y) = E[(Xw - E(Xw))(Y - E(Y))]$$

 

์ด ๋•Œ $Xw$์™€ $Y$๋ฅผ ์ •๊ทœํ™” ์‹œ์ผœ์ฃผ๊ธฐ ๋•Œ๋ฌธ์— $E(Xw)$์™€ $E(Y)$๋Š” ์ž๋™์œผ๋กœ 0์ด ๋˜๊ฒŒ ๋œ๋‹ค. ๋”ฐ๋ผ์„œ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์‹์œผ๋กœ ๊ท€๊ฒฐ๋œ๋‹ค.

 

$$E[(Xw - E(Xw))(Y - E(Y))] = E[Xw \cdot Y]$$

 

์œ„ ์‹์„ $1$๋ถ€ํ„ฐ $n$๊นŒ์ง€ $\sum$์‹์œผ๋กœ ํ’€์–ด์ฃผ๊ฒŒ ๋˜๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™์•„์ง„๋‹ค.

 

$${1\over n}\sum_{i=1}^{n}(Xw)_i Y_i = {1\over n}(Xw)^T Y = {1\over n}w^T(X^TY)$$

 

์‹์„ ์ž˜ ๋ณด๋ฉด $w^T$ ๋ผ๋Š” ๋ฒกํ„ฐ์™€ $X^TY$ ๋ผ๋Š” ๋ฒกํ„ฐ์˜ ๋‚ด์ ์„ ์˜๋ฏธํ•˜๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค. ๊ทธ๋ž˜์„œ ์ด ๋‚ด์ ์˜ ๊ฐ’์ด ์ตœ๋Œ€ํ™”๊ฐ€ ๋˜๋„๋ก ํ•ด์•ผํ•จ์„ ์˜๋ฏธํ•˜๋Š”๋ฐ, ๋‚ด์  ๊ฐ’์ด ์ตœ๋Œ€๊ฐ€ ๋˜๋ ค๋ฉด ๋‘ ๋ฒกํ„ฐ ์‚ฌ์ด์˜ ๊ฐ๋„์ธ $\cos\theta$ ๊ฐ€ ์ตœ๋Œ“๊ฐ’์ด ๋˜์–ด์•ผ ํ•œ๋‹ค. ์ž ์‹œ $\cos\theta$ ์˜ ๊ทธ๋ž˜ํ”„๋ฅผ ์‚ดํŽด๋ณด์ž.

 

์ฝ”์‚ฌ์ธ ๊ทธ๋ž˜ํ”„

 

$\cos\theta$ ๊ทธ๋ž˜ํ”„๋ฅผ ๋ณด๋ฉด $x = 0$๊ฐ’์—์„œ $\cos\theta$ ๊ฐ€ ์ตœ๋Œ€์ž„์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค. ๊ทธ๋ž˜์„œ $w^T$ ๋ฒกํ„ฐ์™€ $X^TY$ ๋ฒกํ„ฐ์˜ $\cos\theta$๊ฐ€$0$์ด๋ผ๋Š” ๊ฒƒ์€ ๋‘ ๋ฒกํ„ฐ๊ฐ€ ๊ฐ™์€ ๋ฐฉํ–ฅ์„ ๊ฐ€๋ฆฌ์ผœ์•ผ ํ•จ์„ ์˜๋ฏธํ•œ๋‹ค.๊ฒฐ๊ตญ $w$๊ฐ’์€ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜๋œ๋‹ค.

 

$$ w^T(X^TY) = \lVert w \rVert \lVert X^TY \rVert \cdot \cos\theta$$

$$ w = X^TY $$

 

 

๊ฒฐ๊ตญ ์œ„ ์‹์„ ์ตœ๋Œ€ํ™”ํ•˜๋ฉด ๋˜๊ณ  ์ด๋ ‡๊ฒŒ ๊ตฌํ•œ $w$๊ฐ’์„ ์•„๊นŒ ์„ ํ˜•๊ฒฐํ•ฉ์ด๋ผ๊ณ  ํ–ˆ๋˜ $t = Xw$ ์‹์— ๋Œ€์ž…ํ•˜๋ฉด ๋œ๋‹ค. ์ด์ œ $t$๊ฐ’๊ณผ $w$๊ฐ’์„ ๊ตฌํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์•Œ์•˜์œผ๋‹ˆ ์ฃผ์„ฑ๋ถ„์˜ ์ผ์ข…์ธ PLS Component๋ฅผ ๊ตฌํ•˜๋ฉด ๋œ๋‹ค. ๊ตฌํ•˜๋Š” ๋‹จ๊ณ„๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

PLS Component ๊ตฌํ•˜๋Š” ๋‹จ๊ณ„

์ฒซ ๋ฒˆ์งธ

์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ, ๋…๋ฆฝ๋ณ€์ˆ˜($X$)์™€ ์ข…์†๋ณ€์ˆ˜($Y$)๋“ค์„ ๋ชจ๋‘ ์ •๊ทœํ™” ์‹œํ‚จ๋‹ค.

๋‘ ๋ฒˆ์งธ

์ดˆ๊ธฐ๊ฐ’์ธ $X_1$, $Y_1$์„ ์„ค์ •ํ•˜๊ณ  ์ฒซ ๋ฒˆ์งธ $t_1$ ๊ฐ’์„ ์ฐพ์•„๋‚ธ๋‹ค. $t_1$๊ฐ’์„ ์ฐพ์•„๋‚ด๋Š” ๋ฐฉ์‹์€ ์œ„์—์„œ ์„ค๋ช…ํ–ˆ๋˜ ๋ฐฉ๋ฒ•์„ ์ด์šฉํ•ด์„œ ๊ณ„์‚ฐํ•œ๋‹ค. 

์„ธ ๋ฒˆ์งธ

์œ„์—์„œ ๊ตฌํ•œ $t_1$๊ฐ’๊ณผ $Y_1$, $X_1$์„ ์ด์šฉํ•ด ๋‘ ๋ฒˆ์งธ $X_2$, $Y_2$๋ฅผ ์„ค์ •ํ•œ๋‹ค. ์ด ๋•Œ๊ฐ€ PLS์˜ ์ค‘์š” ํฌ์ธํŠธ๊ฐ€ ๋“ฑ์žฅํ•œ๋‹ค. ํ•˜๋‚˜ํ•˜๋‚˜์”ฉ ์‚ดํŽด๋ณด์ž.

 

์šฐ์„  $t_1$์€ $Y_1$๊ณผ $X_1$๊ฐ’์„ ํ™œ์šฉํ•ด ๋‚˜์˜จ ๊ฒƒ์ด๊ธฐ ๋•Œ๋ฌธ์— ๋‹ค์Œ๊ณผ ๊ฐ™์€ ํšŒ๊ท€๋ถ„์„์„ ์ •์˜ํ•  ์ˆ˜ ์žˆ๋‹ค.

 

$$Y_1 = \beta_1 t_1 + F_1$$

 

์ด ๋•Œ $\beta_1$์€ ์œ„ ํšŒ๊ท€์‹์—์„œ ์ถ”์ •ํ•ด์•ผ ํ•  ํšŒ๊ท€๊ณ„์ˆ˜๋ฅผ ์˜๋ฏธํ•˜๋ฉฐ $F_1$์€ $Y_1$์„ ์ฃผ์–ด์ง„ ํšŒ๊ท€์‹์œผ๋กœ๋Š” ์„ค๋ช…ํ•  ์ˆ˜ ์—†๋Š” ๋ถ€๋ถ„(Y์ ˆํŽธ์ด๋ผ๊ณ ๋„ ํ•จ)์„ ์˜๋ฏธํ•œ๋‹ค. ์—ฌ๊ธฐ์„œ ์ด์ œ ์ตœ์†Œ์ œ๊ณฑ๋ฒ•์„ ์ด์šฉํ•ด $\beta_1$์„ ์ถ”์ •ํ•œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์šฐ๋ณ€์˜ $F_1$์„ ๋‚จ๊ธฐ๊ณ  ๋ชจ๋‘ ์ขŒ๋ณ€์œผ๋กœ ์ดํ•ญํ•˜๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™์•„์ง„๋‹ค.

 

$$F_1 = Y_1 - \beta_1 t_1$$

 

์œ„์˜ $F_1$์€ ๋‹ค์Œ ๋‹จ๊ณ„์—์„œ ์„ค์ •ํ•  $Y_2$๊ฐ’์œผ๋กœ ์ •์˜ํ•ด์ค€๋‹ค. ๋‹ค์‹œ ๋งํ•ด $Y_1$์„ ํšŒ๊ท€์‹(์ตœ์†Œ์ œ๊ณฑ๋ฒ•)์„ ํ†ตํ•ด ์ถ”์ •ํ–ˆ์ง€๋งŒ ์„ค๋ช…ํ•˜์ง€ ๋ชปํ–ˆ๋˜ ๋ถ€๋ถ„์ธ $F_1$์„ $Y_2$๋กœ ์„ค์ •ํ•จ์œผ๋กœ์จ ๋‹ค์Œ ๋‹จ๊ณ„์—๋Š” ์ด ์„ค๋ช…ํ•˜์ง€ ๋ชปํ•œ ๋ถ€๋ถ„($Y_2$)์„ ๋˜ ํšŒ๊ท€์‹์œผ๋กœ ์ถ”์ •ํ•˜๊ฒŒ ๋˜๋Š” ๊ฒƒ์ด๋‹ค.

 

๊ทธ๋ ‡๋‹ค๋ฉด $X_2$๋Š” ์–ด๋–ป๊ฒŒ ์„ค์ •ํ• ๊นŒ? $Y_2$๋ฅผ ์„ค์ •ํ–ˆ๋˜ ๊ฒƒ ์ฒ˜๋Ÿผ ๋™์ผํ•˜๊ฒŒ ์ˆ˜ํ–‰ํ•œ๋‹ค. ์ด์ „์— $t = Xw$๋ผ๊ณ  ์„ค์ •ํ–ˆ๋“ฏ์ด $X$๋Š” $t$์™€ ์ •ํ™•ํ•œ ๊ฐ’์„ ๋ชจ๋ฅด์ง€๋งŒ ์ž„์˜์˜ ๊ณ„์ˆ˜๊ฐ’์œผ๋กœ ์„ค๋ช…์ด ๊ฐ€๋Šฅํ•˜๋‹ค. ๋”ฐ๋ผ์„œ ๋˜ ํ•˜๋‚˜์˜ ํšŒ๊ท€์‹์ด ์ •์˜๋  ์ˆ˜ ์žˆ๋‹ค.

 

$$X_1 = \alpha_1 t_1 + E_1$$

 

๋˜‘๊ฐ™์ด ์ตœ์†Œ์ œ๊ณฑ๋ฒ•์„ ์ด์šฉํ•ด $\alpha_1$๊ฐ’์„ ์ถ”์ •ํ•˜๊ณ  $E_1$์„ ๋‚จ๊ธฐ๊ณ  ์ขŒ๋ณ€์œผ๋กœ ๋ชจ๋‘ ์ดํ•ญ์‹œ์ผœ $X_2$๊ฐ’์„ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜ํ•œ๋‹ค.

 

$$X_2 = E_1 = X_1 - \alpha_1 t_1$$

๋„ค๋ฒˆ์งธ

์ด๋ ‡๊ฒŒ $p$๊ฐœ(๋…๋ฆฝ๋ณ€์ˆ˜($X$) ๊ฐœ์ˆ˜)๊นŒ์ง€ ๊ณผ์ •์„ ๊ณ„์†์ ์œผ๋กœ ๋ฐ˜๋ณตํ•˜์—ฌ PLS๋ฅผ ์ˆ˜ํ–‰ํ•˜๊ฒŒ ๋œ๋‹ค. ๋งˆ์ง€๋ง‰๊นŒ์ง€ PLS Component๋ฅผ ๊ตฌํ•œ ํ›„ ๋ชจ๋“  PLS ๋ณ€์ˆ˜์˜ ํšŒ๊ท€์‹์œผ๋กœ $\hat{Y}$๊ฐ’์„ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์˜ˆ์ธกํ•œ๋‹ค.

 

$$\hat{Y} = \sum_{i=1}^{k}t_i \beta_i = t_1 \beta_1 + t_2 \beta_2 + t_3 \beta_3 + \cdots + t_k \beta_k$$

 

๊ฒฐ๊ตญ PLS๊ฐ€ ๋™์ž‘ํ•˜๋Š” ๊ณผ์ •์— ๋Œ€ํ•ด ๋„์‹ํ™”ํ•ด๋ณธ๋‹ค๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

 

PLS์˜ ๋™์ž‘๊ณผ์ •์„ ๊ทธ๋ฆผ์œผ๋กœ ๊ทธ๋ ค๋ณด๋ฉด ์ด๋ ‡๋‹ค.

 

์ž, ์ด์ œ PLS์˜ ๊ฑฐ์˜ ๋ชจ๋“  ๋ถ€๋ถ„์„ ๋‹ค ๋ฐฐ์› ๋‹ค. ๊ทธ๋Ÿฐ๋ฐ ๋ญ”๊ฐ€ ํ—ˆ์ „ํ•˜๋‹ค. PLS๋Š” ์ฐจ์› ์ถ•์†Œ ๋ฐฉ๋ฒ•์ด๋ผ๊ณ  ํ–ˆ๋Š”๋ฐ ์ง€๊ธˆ๊นŒ์ง€๋Š” ์ฐจ์›์„ ์ถ•์†Œํ•˜์ง€ ์•Š๊ณ  ๋‹จ์ˆœํžˆ ๋ณ€ํ˜•์„ ์ทจํ•ด์„œ ์ฃผ์„ฑ๋ถ„์„ ๋งŒ๋“  ๊ฒƒ๋งŒ ํ•˜์ง€ ์•Š์•˜๋Š”๊ฐ€? ์ด์ œ PLS ์ฐจ์›์„ ์ถ•์†Œ์‹œ์ผœ๋ณด์ž.

 

PCA๋„ ๊ทธ๋žฌ๋“ฏ์ด ์ฐจ์›์„ ์ถ•์†Œํ•˜๋ ค๋ฉด ์–ด๋Š ์ •๋„์˜ ์ฐจ์›์œผ๋กœ ์ ์ ˆํ•˜๊ฒŒ ์ถ•์†Œํ•ด์•ผ ํ•˜๋Š”์ง€์— ๋Œ€ํ•œ ๊ณ ๋ฏผ์ด ์žˆ๊ธฐ ๋งˆ๋ จ์ด๋‹ค. PLS๋Š” ์ ์ ˆํ•œ ์ฐจ์› ์ˆ˜๋ฅผ ๊ฒฐ์ •ํ•˜๊ธฐ ์œ„ํ•ด ์ฐจ์› ๊ฐœ์ˆ˜์— ๋”ฐ๋ผ $Y$๊ฐ’์„ ์˜ˆ์ธกํ–ˆ์„ ๋•Œ ์ •ํ™•๋„๋ฅผ ๊ธฐ์ค€์œผ๋กœ ๊ฒฐ์ •ํ•œ๋‹ค.(์ฐธ๊ณ ๋กœ PCA์˜ ์ ์ ˆํ•œ ์ฃผ์„ฑ๋ถ„ ๊ฐœ์ˆ˜ ์ฐพ๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด์„œ๋Š” ์—ฌ๊ธฐ์— ์žˆ์œผ๋‹ˆ ๊ถ๊ธˆํ•˜๋ฉด ์•Œ์•„๋ณด๋„๋กํ•˜์ž.)

 

๋ฐฉ๊ธˆ ์œ„์—์„œ ์‚ดํŽด๋ณธ $\hat{Y} = \sum_{i=1}^{k}t_i \beta_i$ ์‹์„ ๊ธฐ๋ฐ˜์œผ๋กœ $i$๊ฐ’์— ๋”ฐ๋ผ ์˜ˆ์ธก ์ •ํ™•๋„๋ฅผ ๋น„๊ตํ•˜๋ฉด ๋œ๋‹ค. ์ด ๋•Œ ๋ฐ์ดํ„ฐ๋ฅผ Train/Test๋กœ ๋ถ„ํ• ํ•œ ๋’ค ๊ฐ๊ฐ์˜ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ์ •ํ™•๋„๋ฅผ ์˜ˆ์ธกํ•˜๊ณ  Train Error์™€ Test Error๋ฅผ ๋น„๊ตํ•˜๋Š” ์‹์œผ๋กœ ์ ์ ˆํ•œ ์ฐจ์› ์ˆ˜๋ฅผ ์„ ์ •ํ•œ๋‹ค. ๋‹ค์Œ ๊ทธ๋ฆผ์„ ๋ณด์ž.(ํ•˜๋‹จ์˜ ๊ทธ๋ฆผ์€ ๊น€์„ฑ๋ฒ”๊ต์ˆ˜๋‹˜์˜ Youtube ๊ฐ•์˜์ž๋ฃŒ์—์„œ ๋ฐœ์ทŒํ–ˆ์Œ์„ ์•Œ๋ฆฝ๋‹ˆ๋‹ค.)

 

PLS์˜ ์ฐจ์› ๊ฐœ์ˆ˜์— ๋”ฐ๋ฅธ Train/Test Error

 

์œ„ ๊ทธ๋ž˜ํ”„์—์„œ Train Error๊ฐ€ ์ ์ ˆํžˆ ๋‚ฎ๋˜ Test Error๊ฐ€ ๊ฐ€์žฅ ๋‚ฎ์„ ๋•Œ์˜ ์ฐจ์› ์ˆ˜๋กœ ํ•˜๋Š” ๊ฒƒ์ด ๊ฐ€์žฅ ์ ์ ˆํ•˜๊ฒŒ ์ฐจ์›์„ ์ถ•์†Œํ•˜๋Š” ๊ฒƒ์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๋‹ค. ๋”ฐ๋ผ์„œ ์œ„ ๊ทธ๋ž˜ํ”„์˜ ๊ฒฝ์šฐ์—์„œ๋Š” 5๊ฐœ์˜ ์ฐจ์›์œผ๋กœ ์ถ•์†Œํ•˜๋Š” ๊ฒƒ์ด ๊ฐ€์žฅ ์ ์ ˆํ•  ๊ฒƒ์ด๋‹ค.

 

์ง€๊ธˆ๊นŒ์ง€ ์‚ดํŽด๋ณธ PLS ๋ฐฉ๋ฒ•์€ ์ผ๋ณ€๋Ÿ‰์ผ ๋•Œ ์‚ฌ์šฉํ•œ ๋ฐฉ๋ฒ•์ด๋‹ค. ๋‹ค๋ณ€๋Ÿ‰์ผ ๋•Œ PLS ๋ฐฉ๋ฒ•๋„ ์กด์žฌํ•˜๋Š”๋ฐ ๋ณธ์งˆ์€ ์œ„ ๋ฐฉ๋ฒ•์—์„œ ๊ณ„์‚ฐ์ด ์ถ”๊ฐ€๋˜๋Š” ๋‚ด์šฉ ๋ฐ–์— ์—†๋‹ค. ์ด์— ๋Œ€ํ•ด ์ž์„ธํ•˜๊ฒŒ ์•Œ๊ณ  ์‹ถ๋‹ค๋ฉด ์›๋ณธ ๊ฐ•์˜์ž๋ฃŒ ์˜์ƒ ํ›„๋ฐ˜๋ถ€๋ฅผ ์‹œ์ฒญํ•ด๋ณด๋„๋ก ํ•˜์ž. 

 

 

๋ฐ˜์‘ํ˜•