๐ ํด๋น ํฌ์คํ ์ ์ธํ๋ฐ ๊ฐ์์ ์บ๊ธ Advanced ๋จธ์ ๋ฌ๋ ์ค์ ๋ฐ์น๊ธฐ ๊ฐ์ ๋ด์ฉ์ ํ ๋๋ก ์ฌ๊ตฌ์ฑํ์์์ ์๋ ค๋๋ฆฝ๋๋ค. ํด๋น ๊ฐ์์ ๋ํด ๋ ๊ถ๊ธํ์๋ค๋ฉด ์ฌ๊ธฐ๋ฅผ ํด๋ฆญํด์ฃผ์ธ์.
์ด๋ฒ ํฌ์คํ ์์๋ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ๊ฐํ๋ ๋ฐฉ๋ฒ์ผ๋ก์ OOF ๋ฐฉ๋ฒ์ด๋ผ๊ณ ์๋ ค์ ธ ์๋ Out Of Fold ๋ฐฉ์์ ๋ํด ์์๋ณด๋ ค๊ณ ํ๋ค. OOF ๋ฐฉ์์ ์ค๋ฌด๋ณด๋ค๋ Kaggle, Dacon๊ณผ ๊ฐ์ ์์ธก ์๊ณ ๋ฆฌ์ฆ ๋ํ์์ ์์ฃผ ์ฌ์ฉ๋๋ ๋ฐฉ์์ด๋ผ๊ณ ํ๋ค. ๊ทธ๋ผ OOF ๋ฐฉ์์ ์ด๋ป๊ฒ ๋์ํ๋ ๊ฑธ๊น?
์ฐ์ OOF ๋ฐฉ์์ Fold๋ฅผ ์ด์ฉํ๋ค. Fold๋ผ.. ์ด๋์์ ๊ฐ ๋ง์ด ๋ค์ด๋ดค์ง ์์๊ฐ!? ๋ฐ์ดํฐ์๊ฐ ์ ์ ๋ ๋ชจ๋ธ์ ์ค๋ฒํผํ ๊ฐ๋ฅ์ฑ์ ์๋ฐฉํ๊ธฐ ์ํด ์์ฃผ ์ฌ์ฉ๋๋ ๊ต์ฐจ๊ฒ์ฆ ๋ฐฉ๋ฒ์ธ K-fold cross validation์์๋ Fold๊ฐ ์ฌ์ฉ๋๋ค! ๊ทธ๋ผ OOF์ Fold์ K-fold์ Fold๋ ์๋ก ๋ค๋ฅผ๊น? ๊ฒฐ๋ก ๋ถํฐ ๋งํ๋ฉด ๋น์ทํ๋ค. ์๋ฐํ ๋งํ๋ฉด, K-fold๋ฅผ ์ด์ฉํ ๊ฒ์ด OOF๋ผ๊ณ ํ ์ ์์ผ๋ฉฐ OOF์์๋ K-fold๊ฐ ์ํ๋ค๊ณ ๋ณผ ์ ์๋ค.
๊ทธ๋ ๋ค๋ฉด ์ด์ OOF ๋ฐฉ์์ด ๋ชจ๋ธ์์ ์ด๋ป๊ฒ ๋์ํ์ฌ ๋ฏธ๋์ ๊ฐ์ ์์ธกํ๋์ง ๊ทธ๋ฆผ์ ํตํด์ ์ดํด๋ณด์.
์ ๊ทธ๋ฆผ์ ์ข์ธก์ 4๊ฐ์ Fold๋ก ๊ต์ฐจ๊ฒ์ฆํ๋ K=4 ์ผ๋์ K-fold ๊ต์ฐจ๊ฒ์ฆ ๋ฐฉ๋ฒ์ด๋ค. ์ด๋ ๊ฒ ์ด 4๋ฒ์ ๊ต์ฐจ๊ฒ์ฆ์ผ๋ก (๋์ผํ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ์ฌ์ฉํ) ์์ธก ์๊ณ ๋ฆฌ์ฆ์ผ๋ก ๊ฐ ๊ฒ์ฆ ๋ฐ์ดํฐ๋ก ํ๊ฐํ Model 1~4๋ฅผ ๋ง๋ค์ด๋ธ๋ค.(์ด ๋, Model 1,2,3,4์์ ๊ฐ๊ฐ ์ต์ ํ๋ ํ๋ผ๋ฏธํฐ ๊ฐ๋ค์ ๋ค๋ฅผ ๊ฒ์ด๋ค. ์๋ํ๋ฉด ๊ฐ ๋ชจ๋ธ์ด ํ์ตํ ๋ฐ์ดํฐ๊ฐ ์๋ก ๋ค๋ฅด๊ธฐ ๋๋ฌธ์ด๋ค.)
๊ทธ๋ฆฌ๊ณ ๋ ํ, Model 1~4๋ฅผ ๋์ผํ ํ ์คํธ ๋ฐ์ดํฐ์ ๋ํด ์์ธกํ๋๋ก ํ์ฌ ๊ฐ Model ๋ณ ํ ์คํธ ๋ฐ์ดํฐ์ ๋ํ ์์ธก๊ฐ์ ๊ณ์ฐํ๋ค. ์ด๋ ๊ฒ ๋๋ฉด ์ ๊ทธ๋ฆผ์์ ๋ ธ๋์ ๋ฐ์ค์ Model 1~4 ์์ธก๊ฐ์ด ๋์ค๊ฒ ๋๋ค.
๋ง์ง๋ง์ผ๋ก ํ ์ผ์ ์ด 4๊ฐ์ ์์ธก๊ฐ๋ค์ ํ๊ท ๊ฐ์ ์ทจํ์ฌ ํ ์คํธ ๋ฐ์ดํฐ์ ๋ํ ์ต์ข ์์ธก๊ฐ์ ๊ณ์ฐํ๋ค.
์ด๋ ๊ฒ OOF ๋ฐฉ๋ฒ์ผ๋ก ์์ธกํ๋ ๋ฐฉ๋ฒ์ ๋ํด ์์๋ณด์๋ค. ์๊ฐ๋ณด๋ค ๊ฐ๋จํ๋ค. ํ์ง๋ง ๋ฌธ๋์๋ ์ธ๊ธํ๋ค์ํผ OOF๋ Kaggle, Dacon ๊ณผ ๊ฐ์ "๋๊ฐ๋๊ฐ ๋ ์ ์์ธกํ๋"๋ฅผ ๋ชฉ์ ์ผ๋ก ํ๋ ์์ธก ์๊ณ ๋ฆฌ์ฆ ๋ํ์์ ์์ฃผ ์ฌ์ฉ๋๋ ๋ฐฉ๋ฒ์ด๋ค. ๋ฐ๋ผ์ ์ค๋ฌด์์๋ ์ ์ฌ์ฉ๋์ง ์๋๋ค๊ณ ํ๋ค.(ํน์ฌ๋ ์ค๋ฌด์๋ ์์ฃผ ์ฌ์ฉ๋๋ค๋ฉด ๋๊ธ ๋ฌ์์ฃผ์ธ์! ์์ง ์ค๋ฌด์๊ฐ ์๋๋ผ...ํํ..)
'Data Science > Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ML] Partial Least Squares(๋ถ๋ถ ์ต์์ ๊ณฑ๋ฒ) (2) | 2021.03.14 |
---|---|
[ML] Regression metric ๊ณผ Elastic net regression (2) | 2021.01.18 |
[ML] Bayesian Optimization์ผ๋ก ํ๋ผ๋ฏธํฐ ํ๋ํ๊ธฐ (0) | 2021.01.02 |
[ML] PCA, ์ฃผ์ฑ๋ถ์ ๊ฐ์๋ ์ด๋ค ๊ธฐ์ค์ผ๋ก ์ค์ ํ ๊น? (6) | 2020.12.08 |
[ML] ๋น์ ์ ๋ฐ์ดํฐ๋ฅผ ์ฌ๋ฐ๋ฅด๊ฒ ๋ถํ ํ๊ณ ์๋๊ฐ? (0) | 2020.11.12 |