๐ํด๋น ํฌ์คํ ์์ ์ฌ์ฉ๋ ์๋ฃ๋ ๊ณ ๋ ค๋ํ๊ต ์ฐ์ ๊ฒฝ์๊ณตํ๋ถ ๊น์ฑ๋ฒ๊ต์๋์ Youtube ๊ฐ์์๋ฃ์ ๊ธฐ๋ฐํ์์ ์๋ ค๋๋ฆฝ๋๋ค. ํน์ฌ๋ ์ถ์ฒ๋ฅผ ๋ฐํ์์๋ ๋ถ๊ตฌํ๊ณ ์ ์๊ถ์ ๋ฌธ์ ๊ฐ ๋๋ค๋ฉด joyh951021@gmail.com์ผ๋ก ์ฐ๋ฝ์ฃผ์๋ฉด ํด๋น ์๋ฃ๋ฅผ ์ญ์ ํ๊ฒ ์ต๋๋ค. ๊ฐ์ฌํฉ๋๋ค.(์ ์๊ถ์ ๋ฌธ์ ๊ฐ ๋์ง ์๋๋ก ์ฌ์ง์ ์ต๋ํ ์ ๊ฐ ์ง์ ๋ง๋ ์๋ฃ๋ก ๋์ฒดํ์ต๋๋ค :) )
์ด๋ฒ ํฌ์คํ ์์๋ Feature Extraction์ ๋ฐฉ๋ฒ ์ค ํ๋์ธ Parital Least Squares(๋ถ๋ถ ์ต์์ ๊ณฑ๋ฒ)์ ๋ํด ์์๋ณด๋ ค๊ณ ํ๋ค. ๋ถ๋ถ ์ต์์ ๊ณฑ๋ฒ์ Feature Extraction ๋ฐฉ๋ฒ ์ค์์๋ Supervisedํ ๋ฐฉ๋ฒ์ ์ํ๋ค. ์๋ Feature Extraction์์๋ Supervised์ Unsupervised๊ฐ ๋๋์ด์ ธ ์๋ ๊ฑด๊ฐ? ๊ฒฐ๋ก ๋ถํฐ ๋งํ๋ฉด ๋ง๋ค.
๋ฐ๋ผ์ ๋ถ๋ถ ์ต์์ ๊ณฑ๋ฒ์ ์๊ฐํ๊ธฐ ์ด์ ์ Feature Selection๊ณผ Feature Extraction์ ์ฐจ์ด๊ฐ ๋ฌด์์ธ์ง, ๊ทธ๋ฆฌ๊ณ ๊ฐ๊ฐ์ ๋ฐฉ๋ฒ์์๋ Supervised, Unsupervisedํ ๋ฐฉ๋ฒ์ ์ฐจ์ด๊ฐ ๋ฌด์์ธ์ง ์์๋ณด์.
๋จผ์ Feature Extraction๊ณผ Feature Selection์ ์ฐจ์ด์ ์ ๋ฌด์์ผ๊น? ์ฐ์ ํ๊ตญ์ด๋ก ํด์ํ์๋ฉด '์ถ์ถ'๊ณผ '์ ํ'์ ์๋ฏธ์ ์ฐจ์ด๊ฐ ์๋ค. ์ข ๋ ๋ฐ์ดํฐ ์ฐจ์์์ ์๋ฏธ๋ฅผ ํ์ฅํด๋ณธ๋ค๋ฉด '์ถ์ถ'์ ๊ธฐ์กด์ ๊ฒ๋ค์ ๋ฌด์์ธ๊ฐ ๋ณํ์ ์ทจํด ์๋ก์ด ๊ฒ์ ๋ง๋ค์ด๋ด๋ ์๋ฏธ์ธ ๋ฐ๋ฉด '์ ํ'์ ๊ธฐ์กด์ ๊ฒ๋ค์ ๊ทธ๋๋ก ๋ ์ฑ ํ๋(๋๋ ๊ทธ ์ด์)๋ฅผ ์ ํํ๋ ๊ฒ์ ์๋ฏธํ๋ค. ๋ ๊ฐ์ ์ฐจ์ด๋ฅผ ๊ทธ๋ฆผ์ผ๋ก ํ์ธํด๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.
์ด์ ๋ ๊ฐ์ง์ ์ฐจ์ด์ ์ ์์์ผ๋ ๊ฐ ๋ฐฉ๋ฒ์ ์์ด์ Supervised์ Unsupervised์ ์ฐจ์ด์ ์ ๋ฌด์์ผ๊น? ๋ฐ๋ก ์ข ์๋ณ์ ์ฆ, Y๊ฐ์ ๊ณ ๋ คํ์ฌ ๋ณ์๋ฅผ ์ถ์ถ(๋๋ ์ ํ)ํ๋์ง ์ฌ๋ถ์ด๋ค. ์ฐ๋ฆฌ๊ฐ ์ด์ ์ ๋จธ์ ๋ฌ๋์ ๊ธฐ๋ณธ ๋ชจ๋ธ ์ข ๋ฅ๋ฅผ ๋ฐฐ์ธ ๋ ์ง๋(Supervised) ํ์ต, ๋น์ง๋(Unsupervised) ํ์ต์ผ๋ก ๋๋์ด ๋ฐฐ์ด ๊ฒ์ฒ๋ผ Feature Extraction๊ณผ Feature Selection ์์๋ ๋์ผํ๋ค. ๊ฐ ๋ฐฉ๋ฒ๋ค์ ์์ธํ ๊ธฐ๋ฒ ์ ๋ณด๋ ๋ค์๊ณผ ๊ฐ๋ค.
์ด์ ์ฐ๋ฆฌ๊ฐ ์ค์ ์ ์ผ๋ก ๋ค๋ฃฐ ์ฃผ์ ๋ ์ ๊ทธ๋ฆผ์ ๊ฐ์ฅ ์ผ์ชฝ์ ์๋ PLS์ธ ๋ถ๋ถ ์ต์์ ๊ณฑ๋ฒ์ด๋ค. PLS๋ Supervisedํ ๋ฐฉ๋ฒ์ผ๋ก์ Y๊ฐ์ ๊ณ ๋ คํด์ ์ฐจ์์ ์ถ์ํ๊ฒ ๋๋ค. ์ด ๋ Y๊ฐ์ ๊ณ ๋ คํ๋ค๋ผ๋ ๊ฒ์ Y๊ฐ์ ๋ถ์ฐ์ ํ์ฉํ๋ ๊ฒ์ ์๋ฏธํ๋ค. ๋ฐ๋ผ์ PLS๋ X๋ผ๋ ๋ ๋ฆฝ๋ณ์๋ค์ ์ ํ๊ฒฐํฉ๊ณผ Y๋ผ๋ ์ข ์๋ณ์ ์ด 2๊ฐ ๊ฐ์ ๊ณต๋ถ์ฐ์ ์ต๋ํํ๋ ์๋ก์ด ๋ณ์๋ก ์ถ์ถ(Extraction)ํ๋ ๊ฒ์ ์๋ฏธํ๋ค.
PLS๋ฅผ PCA์ ๋น๊ตํด ์ค๋ช ํ๋ค๊ณ ํ๋ฉด, PCA์ ๊ฐ์ $X$๋ณ์๋ค ๊ฐ์ ์ผ๋ฐ์ ์ธ ์ ํ๊ฒฐํฉ์ผ๋ก ์ถ์ถ๋ ์๋ก์ด ๋ณ์๊ฐ ์ค๋ช ํ์ง ๋ชปํ๋ ๋ถ๋ถ์ ๋ฐ๋ณต์ ์ธ ์ต์์ ๊ณฑ๋ฒ์ ํ์ฉํ๋ ๊ฒ์ด PLS์ด๋ค. ์ด๋ ๊ฒ ๋ง๋ก๋ง ํ๋ค๋ฉด ์ ๋๋ก ์ดํด๊ฐ ๋์ง ์์ ๊ฒ์ด๋ค. ๋ช ๊ฐ์ง ์์์ ์ดํด๋ณด๋ฉด์ ์ดํดํด๋ณด์.
์ฐ์ $X$๋ ์ ๋ ฅ๋ณ์, $Y$๋ ์ถ๋ ฅ๋ณ์, $t$๋ PCA ์ํํ ๋์ ๋์ผํ ์ผ๋ฐ์ ์ธ $X$์ ์ ํ๊ฒฐํฉ, $w$๋ ์ ํ๊ฒฐํฉ์ ๊ณ์(๊ฐ์ค์น)๋ฅผ ์๋ฏธํ๋ค. ์ด ๋ ์ผ๋ฐ์ ์ธ $X$์ ์ ํ ๊ฒฐํฉ์ผ๋ก ์ธํด ๋ค์๊ณผ ๊ฐ์ ์์ ๋ง์กฑํ๋ค.
$$t = Xw$$
์ด์ $X$์ ์ ํ๊ฒฐํฉ์ธ $t$์ ์ข ์๋ณ์์ธ $Y$๊ฐ์ ๊ณต๋ถ์ฐ์ ๊ณ์ฐํด๋ณด์. ๊ณ์ฐํ๊ธฐ ์ํด ์ผ์์ ์ธ ๊ณ์ฐ ํธ๋ฆญ์ ์ฌ์ฉํ ๊ฒ์ด๋ค. ๋ฐ๋ก ์ฐ๋ณ์ $t$์ $Y$์ ๊ฐ ํ์คํธ์ฐจ๋ก ๋๋์ด์ฃผ๊ณ ๋ค์ ๊ณฑํด์ค๋ค.
$$Cov(t, Y) = {Cov(t, Y)\over\sqrt{Var(t)}\sqrt{Var(Y)}}\sqrt{Var(t)}\sqrt{Var(Y)}$$
์ด ๋ ์ ๊ณต์์ ์ ์ดํด๋ณด๋ฉด $t$์ $Y$๊ฐ์ ์๊ด๊ด๊ณ(Correlation) ๊ณต์์ด ์จ์ด์์์ ์ ์ ์๋ค. ๋ฐ๋ผ์ ์์ ๋ค์๊ณผ ๊ฐ์์ง๋ค.
$$Cov(t, Y) = Corr(t, Y)\sqrt{Var(t)}\sqrt{Var(Y)}$$
๋ฐ๋ผ์ $\max [Cov(t, Y)]$๋ $\max [Corr(t, Y)Var(t)]$์ ๋์ผํ๊ฒ ๋๋ค. $Y$๊ฐ์ ์ด๋ฏธ ์ฃผ์ด์ ธ ์๋ ๊ฐ์ด๊ธฐ ๋๋ฌธ์ $Var(Y)$๋ฅผ ์ต๋ํํ ์ ์๋ค. ๋ฐ๋ผ์ ์ฐ๋ฆฌ๊ฐ ํ ์ ์๋ ๋ถ๋ถ์ ์ ํ๊ฒฐํฉ์ธ $t$์ ๋ถ์ฐ์ธ $Var(t)$์ $Corr(t, Y)$์ ๊ณฑ์ ์ต๋ํํ๋ ๊ฒ์ด๋ค.
์ฐ๋ฆฌ๊ฐ ์ํ๋ ์กฐ๊ฑด(์ต๋ํ)์ ๋ง์กฑ์ํค๊ธฐ ์ํด์๋ $t$๋ฅผ ์์์ผ ํ๋ค. ๊ทธ๋ฐ๋ฐ $t = Xw$์ด๊ธฐ ๋๋ฌธ์ $w$๊ฐ์ ์๊ฒ๋๋ฉด $t$๊ฐ๋ ์๋์ผ๋ก ์๊ฒ ๋๋ค. ์ฐ์ $t$์๋ค๊ฐ $Xw$๋ฅผ ๋์ ํด์ $\max Cov(Xw, Y)$๋ฅผ ๊ณ์ฐํด๋ณด์.
$$Cov(Xw, Y) = E[(Xw - E(Xw))(Y - E(Y))]$$
์ด ๋ $Xw$์ $Y$๋ฅผ ์ ๊ทํ ์์ผ์ฃผ๊ธฐ ๋๋ฌธ์ $E(Xw)$์ $E(Y)$๋ ์๋์ผ๋ก 0์ด ๋๊ฒ ๋๋ค. ๋ฐ๋ผ์ ๋ค์๊ณผ ๊ฐ์ ์์ผ๋ก ๊ท๊ฒฐ๋๋ค.
$$E[(Xw - E(Xw))(Y - E(Y))] = E[Xw \cdot Y]$$
์ ์์ $1$๋ถํฐ $n$๊น์ง $\sum$์์ผ๋ก ํ์ด์ฃผ๊ฒ ๋๋ฉด ๋ค์๊ณผ ๊ฐ์์ง๋ค.
$${1\over n}\sum_{i=1}^{n}(Xw)_i Y_i = {1\over n}(Xw)^T Y = {1\over n}w^T(X^TY)$$
์์ ์ ๋ณด๋ฉด $w^T$ ๋ผ๋ ๋ฒกํฐ์ $X^TY$ ๋ผ๋ ๋ฒกํฐ์ ๋ด์ ์ ์๋ฏธํ๋ ๊ฒ์ ์ ์ ์๋ค. ๊ทธ๋์ ์ด ๋ด์ ์ ๊ฐ์ด ์ต๋ํ๊ฐ ๋๋๋ก ํด์ผํจ์ ์๋ฏธํ๋๋ฐ, ๋ด์ ๊ฐ์ด ์ต๋๊ฐ ๋๋ ค๋ฉด ๋ ๋ฒกํฐ ์ฌ์ด์ ๊ฐ๋์ธ $\cos\theta$ ๊ฐ ์ต๋๊ฐ์ด ๋์ด์ผ ํ๋ค. ์ ์ $\cos\theta$ ์ ๊ทธ๋ํ๋ฅผ ์ดํด๋ณด์.
$\cos\theta$ ๊ทธ๋ํ๋ฅผ ๋ณด๋ฉด $x = 0$๊ฐ์์ $\cos\theta$ ๊ฐ ์ต๋์์ ์ ์ ์๋ค. ๊ทธ๋์ $w^T$ ๋ฒกํฐ์ $X^TY$ ๋ฒกํฐ์ $\cos\theta$๊ฐ$0$์ด๋ผ๋ ๊ฒ์ ๋ ๋ฒกํฐ๊ฐ ๊ฐ์ ๋ฐฉํฅ์ ๊ฐ๋ฆฌ์ผ์ผ ํจ์ ์๋ฏธํ๋ค.๊ฒฐ๊ตญ $w$๊ฐ์ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋๋ค.
$$ w^T(X^TY) = \lVert w \rVert \lVert X^TY \rVert \cdot \cos\theta$$
$$ w = X^TY $$
๊ฒฐ๊ตญ ์ ์์ ์ต๋ํํ๋ฉด ๋๊ณ ์ด๋ ๊ฒ ๊ตฌํ $w$๊ฐ์ ์๊น ์ ํ๊ฒฐํฉ์ด๋ผ๊ณ ํ๋ $t = Xw$ ์์ ๋์ ํ๋ฉด ๋๋ค. ์ด์ $t$๊ฐ๊ณผ $w$๊ฐ์ ๊ตฌํ๋ ๋ฐฉ๋ฒ์ ์์์ผ๋ ์ฃผ์ฑ๋ถ์ ์ผ์ข ์ธ PLS Component๋ฅผ ๊ตฌํ๋ฉด ๋๋ค. ๊ตฌํ๋ ๋จ๊ณ๋ ๋ค์๊ณผ ๊ฐ๋ค.
PLS Component ๊ตฌํ๋ ๋จ๊ณ
์ฒซ ๋ฒ์งธ
์ฃผ์ด์ง ๋ฐ์ดํฐ, ๋ ๋ฆฝ๋ณ์($X$)์ ์ข ์๋ณ์($Y$)๋ค์ ๋ชจ๋ ์ ๊ทํ ์ํจ๋ค.
๋ ๋ฒ์งธ
์ด๊ธฐ๊ฐ์ธ $X_1$, $Y_1$์ ์ค์ ํ๊ณ ์ฒซ ๋ฒ์งธ $t_1$ ๊ฐ์ ์ฐพ์๋ธ๋ค. $t_1$๊ฐ์ ์ฐพ์๋ด๋ ๋ฐฉ์์ ์์์ ์ค๋ช ํ๋ ๋ฐฉ๋ฒ์ ์ด์ฉํด์ ๊ณ์ฐํ๋ค.
์ธ ๋ฒ์งธ
์์์ ๊ตฌํ $t_1$๊ฐ๊ณผ $Y_1$, $X_1$์ ์ด์ฉํด ๋ ๋ฒ์งธ $X_2$, $Y_2$๋ฅผ ์ค์ ํ๋ค. ์ด ๋๊ฐ PLS์ ์ค์ ํฌ์ธํธ๊ฐ ๋ฑ์ฅํ๋ค. ํ๋ํ๋์ฉ ์ดํด๋ณด์.
์ฐ์ $t_1$์ $Y_1$๊ณผ $X_1$๊ฐ์ ํ์ฉํด ๋์จ ๊ฒ์ด๊ธฐ ๋๋ฌธ์ ๋ค์๊ณผ ๊ฐ์ ํ๊ท๋ถ์์ ์ ์ํ ์ ์๋ค.
$$Y_1 = \beta_1 t_1 + F_1$$
์ด ๋ $\beta_1$์ ์ ํ๊ท์์์ ์ถ์ ํด์ผ ํ ํ๊ท๊ณ์๋ฅผ ์๋ฏธํ๋ฉฐ $F_1$์ $Y_1$์ ์ฃผ์ด์ง ํ๊ท์์ผ๋ก๋ ์ค๋ช ํ ์ ์๋ ๋ถ๋ถ(Y์ ํธ์ด๋ผ๊ณ ๋ ํจ)์ ์๋ฏธํ๋ค. ์ฌ๊ธฐ์ ์ด์ ์ต์์ ๊ณฑ๋ฒ์ ์ด์ฉํด $\beta_1$์ ์ถ์ ํ๋ค. ๊ทธ๋ฆฌ๊ณ ์ฐ๋ณ์ $F_1$์ ๋จ๊ธฐ๊ณ ๋ชจ๋ ์ข๋ณ์ผ๋ก ์ดํญํ๋ฉด ๋ค์๊ณผ ๊ฐ์์ง๋ค.
$$F_1 = Y_1 - \beta_1 t_1$$
์์ $F_1$์ ๋ค์ ๋จ๊ณ์์ ์ค์ ํ $Y_2$๊ฐ์ผ๋ก ์ ์ํด์ค๋ค. ๋ค์ ๋งํด $Y_1$์ ํ๊ท์(์ต์์ ๊ณฑ๋ฒ)์ ํตํด ์ถ์ ํ์ง๋ง ์ค๋ช ํ์ง ๋ชปํ๋ ๋ถ๋ถ์ธ $F_1$์ $Y_2$๋ก ์ค์ ํจ์ผ๋ก์จ ๋ค์ ๋จ๊ณ์๋ ์ด ์ค๋ช ํ์ง ๋ชปํ ๋ถ๋ถ($Y_2$)์ ๋ ํ๊ท์์ผ๋ก ์ถ์ ํ๊ฒ ๋๋ ๊ฒ์ด๋ค.
๊ทธ๋ ๋ค๋ฉด $X_2$๋ ์ด๋ป๊ฒ ์ค์ ํ ๊น? $Y_2$๋ฅผ ์ค์ ํ๋ ๊ฒ ์ฒ๋ผ ๋์ผํ๊ฒ ์ํํ๋ค. ์ด์ ์ $t = Xw$๋ผ๊ณ ์ค์ ํ๋ฏ์ด $X$๋ $t$์ ์ ํํ ๊ฐ์ ๋ชจ๋ฅด์ง๋ง ์์์ ๊ณ์๊ฐ์ผ๋ก ์ค๋ช ์ด ๊ฐ๋ฅํ๋ค. ๋ฐ๋ผ์ ๋ ํ๋์ ํ๊ท์์ด ์ ์๋ ์ ์๋ค.
$$X_1 = \alpha_1 t_1 + E_1$$
๋๊ฐ์ด ์ต์์ ๊ณฑ๋ฒ์ ์ด์ฉํด $\alpha_1$๊ฐ์ ์ถ์ ํ๊ณ $E_1$์ ๋จ๊ธฐ๊ณ ์ข๋ณ์ผ๋ก ๋ชจ๋ ์ดํญ์์ผ $X_2$๊ฐ์ ๋ค์๊ณผ ๊ฐ์ด ์ ์ํ๋ค.
$$X_2 = E_1 = X_1 - \alpha_1 t_1$$
๋ค๋ฒ์งธ
์ด๋ ๊ฒ $p$๊ฐ(๋ ๋ฆฝ๋ณ์($X$) ๊ฐ์)๊น์ง ๊ณผ์ ์ ๊ณ์์ ์ผ๋ก ๋ฐ๋ณตํ์ฌ PLS๋ฅผ ์ํํ๊ฒ ๋๋ค. ๋ง์ง๋ง๊น์ง PLS Component๋ฅผ ๊ตฌํ ํ ๋ชจ๋ PLS ๋ณ์์ ํ๊ท์์ผ๋ก $\hat{Y}$๊ฐ์ ๋ค์๊ณผ ๊ฐ์ด ์์ธกํ๋ค.
$$\hat{Y} = \sum_{i=1}^{k}t_i \beta_i = t_1 \beta_1 + t_2 \beta_2 + t_3 \beta_3 + \cdots + t_k \beta_k$$
๊ฒฐ๊ตญ PLS๊ฐ ๋์ํ๋ ๊ณผ์ ์ ๋ํด ๋์ํํด๋ณธ๋ค๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.
์, ์ด์ PLS์ ๊ฑฐ์ ๋ชจ๋ ๋ถ๋ถ์ ๋ค ๋ฐฐ์ ๋ค. ๊ทธ๋ฐ๋ฐ ๋ญ๊ฐ ํ์ ํ๋ค. PLS๋ ์ฐจ์ ์ถ์ ๋ฐฉ๋ฒ์ด๋ผ๊ณ ํ๋๋ฐ ์ง๊ธ๊น์ง๋ ์ฐจ์์ ์ถ์ํ์ง ์๊ณ ๋จ์ํ ๋ณํ์ ์ทจํด์ ์ฃผ์ฑ๋ถ์ ๋ง๋ ๊ฒ๋ง ํ์ง ์์๋๊ฐ? ์ด์ PLS ์ฐจ์์ ์ถ์์์ผ๋ณด์.
PCA๋ ๊ทธ๋ฌ๋ฏ์ด ์ฐจ์์ ์ถ์ํ๋ ค๋ฉด ์ด๋ ์ ๋์ ์ฐจ์์ผ๋ก ์ ์ ํ๊ฒ ์ถ์ํด์ผ ํ๋์ง์ ๋ํ ๊ณ ๋ฏผ์ด ์๊ธฐ ๋ง๋ จ์ด๋ค. PLS๋ ์ ์ ํ ์ฐจ์ ์๋ฅผ ๊ฒฐ์ ํ๊ธฐ ์ํด ์ฐจ์ ๊ฐ์์ ๋ฐ๋ผ $Y$๊ฐ์ ์์ธกํ์ ๋ ์ ํ๋๋ฅผ ๊ธฐ์ค์ผ๋ก ๊ฒฐ์ ํ๋ค.(์ฐธ๊ณ ๋ก PCA์ ์ ์ ํ ์ฃผ์ฑ๋ถ ๊ฐ์ ์ฐพ๋ ๋ฐฉ๋ฒ์ ๋ํด์๋ ์ฌ๊ธฐ์ ์์ผ๋ ๊ถ๊ธํ๋ฉด ์์๋ณด๋๋กํ์.)
๋ฐฉ๊ธ ์์์ ์ดํด๋ณธ $\hat{Y} = \sum_{i=1}^{k}t_i \beta_i$ ์์ ๊ธฐ๋ฐ์ผ๋ก $i$๊ฐ์ ๋ฐ๋ผ ์์ธก ์ ํ๋๋ฅผ ๋น๊ตํ๋ฉด ๋๋ค. ์ด ๋ ๋ฐ์ดํฐ๋ฅผ Train/Test๋ก ๋ถํ ํ ๋ค ๊ฐ๊ฐ์ ๋ฐ์ดํฐ์ ๋ํด ์ ํ๋๋ฅผ ์์ธกํ๊ณ Train Error์ Test Error๋ฅผ ๋น๊ตํ๋ ์์ผ๋ก ์ ์ ํ ์ฐจ์ ์๋ฅผ ์ ์ ํ๋ค. ๋ค์ ๊ทธ๋ฆผ์ ๋ณด์.(ํ๋จ์ ๊ทธ๋ฆผ์ ๊น์ฑ๋ฒ๊ต์๋์ Youtube ๊ฐ์์๋ฃ์์ ๋ฐ์ทํ์์ ์๋ฆฝ๋๋ค.)
์ ๊ทธ๋ํ์์ Train Error๊ฐ ์ ์ ํ ๋ฎ๋ Test Error๊ฐ ๊ฐ์ฅ ๋ฎ์ ๋์ ์ฐจ์ ์๋ก ํ๋ ๊ฒ์ด ๊ฐ์ฅ ์ ์ ํ๊ฒ ์ฐจ์์ ์ถ์ํ๋ ๊ฒ์ด๋ผ๊ณ ํ ์ ์๋ค. ๋ฐ๋ผ์ ์ ๊ทธ๋ํ์ ๊ฒฝ์ฐ์์๋ 5๊ฐ์ ์ฐจ์์ผ๋ก ์ถ์ํ๋ ๊ฒ์ด ๊ฐ์ฅ ์ ์ ํ ๊ฒ์ด๋ค.
์ง๊ธ๊น์ง ์ดํด๋ณธ PLS ๋ฐฉ๋ฒ์ ์ผ๋ณ๋์ผ ๋ ์ฌ์ฉํ ๋ฐฉ๋ฒ์ด๋ค. ๋ค๋ณ๋์ผ ๋ PLS ๋ฐฉ๋ฒ๋ ์กด์ฌํ๋๋ฐ ๋ณธ์ง์ ์ ๋ฐฉ๋ฒ์์ ๊ณ์ฐ์ด ์ถ๊ฐ๋๋ ๋ด์ฉ ๋ฐ์ ์๋ค. ์ด์ ๋ํด ์์ธํ๊ฒ ์๊ณ ์ถ๋ค๋ฉด ์๋ณธ ๊ฐ์์๋ฃ ์์ ํ๋ฐ๋ถ๋ฅผ ์์ฒญํด๋ณด๋๋ก ํ์.
'Data Science > Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ML] Unbiased boosting : CatBoost (0) | 2021.07.18 |
---|---|
[ML] ์ฃผ์ ์ธ์ ํ์ง ๋ฐฉ๋ฒ์ธ FDR(False Discovery Rate) (0) | 2021.03.15 |
[ML] Regression metric ๊ณผ Elastic net regression (2) | 2021.01.18 |
[ML] Out Of Fold(OOF) ๋ฐฉ๋ฒ์ผ๋ก ๋ชจ๋ธ ํ๊ฐํ๊ธฐ (4) | 2021.01.11 |
[ML] Bayesian Optimization์ผ๋ก ํ๋ผ๋ฏธํฐ ํ๋ํ๊ธฐ (0) | 2021.01.02 |