๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

Data Science/Machine Learning

[ML] Explainable AI - Shapley Value

๋ฐ˜์‘ํ˜•

๐Ÿ”‰ํ•ด๋‹น ํฌ์ŠคํŒ…์—์„œ ์‚ฌ์šฉ๋œ ์ž๋ฃŒ๋Š” ๊ณ ๋ ค๋Œ€ํ•™๊ต ์‚ฐ์—…๊ฒฝ์˜๊ณตํ•™๋ถ€ ๊น€์„ฑ๋ฒ”๊ต์ˆ˜๋‹˜์˜ Youtube ๊ฐ•์˜์ž๋ฃŒ์— ๊ธฐ๋ฐ˜ํ–ˆ์Œ์„ ์•Œ๋ ค๋“œ๋ฆฝ๋‹ˆ๋‹ค. ํ˜น์—ฌ๋‚˜ ์ถœ์ฒ˜๋ฅผ ๋ฐํ˜”์Œ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์ €์ž‘๊ถŒ์˜ ๋ฌธ์ œ๊ฐ€ ๋œ๋‹ค๋ฉด joyh951021@gmail.com์œผ๋กœ ์—ฐ๋ฝ์ฃผ์‹œ๋ฉด ํ•ด๋‹น ์ž๋ฃŒ๋ฅผ ์‚ญ์ œํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค.

 

์ด๋ฒˆ ํฌ์ŠคํŒ…์—์„œ๋Š” ์„ค๋ช…์ด ๊ฐ€๋Šฅํ•œ ์ธ๊ณต์ง€๋Šฅ(Explainable AI)์„ ๋งŒ๋“ค๊ธฐ ์œ„ํ•œ ํ•˜๋‚˜์˜ ์š”์†Œ๋กœ์„œ Shapley Value์— ๋Œ€ํ•ด ์†Œ๊ฐœํ•˜๊ณ ์ž ํ•œ๋‹ค. Explainable AI๋ผ๊ณ  ํ•˜๋ฉด ๋ฌด์—‡์ธ๊ฐ€ ์—„์ฒญ ๊ฑฐ๋Œ€ํ•ด ๋ณด์ผ ์ˆ˜ ์žˆ์ง€๋งŒ ์šฐ๋ฆฌ๊ฐ€ ํ”ํžˆ ์‚ฌ์šฉํ•ด์™”๋˜ Scikit-learn ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์—์„œ๋„ ๊ด€๋ จ๋œ ๊ฒƒ๋“ค์„ ์ฐพ์•„๋ณผ ์ˆ˜ ์žˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค๋ฉด Tree-based ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋‚˜ Boosting ๊ณ„์—ด ์•Œ๊ณ ๋ฆฌ์ฆ˜๋“ค์€ Feature Importance๋ผ๊ณ  Feature ๋ณ„ ์ค‘์š”๋„๋ฅผ ๊ณ„์‚ฐํ•ด์ฃผ๋Š” ๋ฉ”์†Œ๋“œ๊ฐ€ ์žˆ๋‹ค. ๋˜ํ•œ ํŠน์ • ์ž…๋ ฅ ๋ณ€์ˆ˜๋ฅผ Shuffle ํ•˜๊ณ  ์˜ˆ์ธก๋ ฅ์„ ํ…Œ์ŠคํŠธํ•ด์„œ Shuffle ํ•˜๊ธฐ ์ „/ํ›„ ์˜ˆ์ธก๋ ฅ์˜ ์ฐจ์ด๊ฐ€ ๋งŽ์ด ๋‚˜๋ฉด ๊ทธ๋งŒํผ ์ค‘์š”ํ•˜๋‹ค๊ณ  ํŒ๋‹จํ•˜๋Š” Permutation Importance ๋ฉ”์†Œ๋“œ๋„ ์กด์žฌํ•œ๋‹ค.

 

์ด์™€ ๋น„์Šทํ•œ ๋˜ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•์œผ๋กœ Shapley Value๊ฐ€ ์žˆ๋‹ค. ๊ธฐ๋ณธ์ ์œผ๋กœ ๊ฒŒ์ž„ ์ด๋ก ์—์„œ ๊ธฐ๋ฐ˜ํ•œ ์ด๋ก ์ด๋ผ๋Š”๋ฐ, ํ•ด๋‹น ๊ฐ•์˜ ์† ๊ต์ˆ˜๋‹˜์€ ๊ฒŒ์ž„ ์ด๋ก ์— ๋Œ€ํ•œ ์ง€์‹์ด ์ „๋ฌดํ•˜๋”๋ผ๋„  Shapley Value ์ด๋ก ์— ๋Œ€ํ•ด์„œ ์ถฉ๋ถ„ํžˆ ์ตํž ์ˆ˜ ์žˆ๋‹ค๊ณ  ํ•˜๋ฉด์„œ ์„ค๋ช…์„ ์‹œ์ž‘ํ•˜์‹ ๋‹ค. ๊ทธ๋Ÿผ ์ด์ œ Shapley Value์— ๋Œ€ํ•ด์„œ ๋ณธ๊ฒฉ์ ์œผ๋กœ ์•Œ์•„๋ณด์ž.

 

XAI(Explainable AI)๋Š” ์ •๋ง ๊ฐ€๋Šฅํ• ๊นŒ?


Shapley Value์˜ ๊ธฐ๋ณธ์ ์ธ ์•„์ด๋””์–ด๋Š” ํŠน์ • ๋ณ€์ˆ˜๊ฐ€ ์˜ˆ์ธก๋ ฅ์— ์–ผ๋งˆ๋‚˜ ๊ธฐ์—ฌํ•˜๋Š”์ง€ ํŒŒ์•…ํ•˜๊ธฐ ์œ„ํ•ด ์ด ํŠน์ • ๋ณ€์ˆ˜์™€ ๊ด€๋ จ๋œ ๋ชจ๋“  ๋ณ€์ˆ˜ ์กฐํ•ฉ๋“ค์„ ์ž…๋ ฅ์‹œ์ผฐ์„ ๋•Œ ๋‚˜์˜จ ๊ฒฐ๊ณผ๊ฐ’๊ณผ ๋น„๊ต๋ฅผ ํ•˜๋ฉด์„œ ๋ณ€์ˆ˜์˜ ๊ธฐ์—ฌ๋„๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค. ์ข€ ๋” ์ง๊ด€์ ์œผ๋กœ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•ด ๊ฐ•์˜ ์† ๊ต์ˆ˜๋‹˜๊ป˜์„œ ๋“ค์–ด์ฃผ์‹  ๊ฐ„๋‹จํ•œ ์˜ˆ์‹œ๋ฅผ ํ†ตํ•ด์„œ ํ•จ๊ป˜ ์ดํ•ดํ•ด๋ณด์ž.

 

์˜ˆ์‹œ ๋ฐ์ดํ„ฐ

 

์œ„์™€ ๊ฐ™์ด 3๊ฐœ์˜ ๋ณ€์ˆ˜ $x_1$ ๋ถ€ํ„ฐ $x_3$ ๊นŒ์ง€ 3๊ฐœ์˜ ์ž…๋ ฅ๋ณ€์ˆ˜๊ฐ€ ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ๊ฐ€ ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜์ž. ๊ทธ๋ฆฌ๊ณ  Case 1๋ฒˆ๋ถ€ํ„ฐ 8๋ฒˆ๊นŒ์ง€ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ ๋ณ€์ˆ˜๊ฐ€ ๋“ค์–ด๊ฐˆ ์ˆ˜ ์žˆ๋Š” ๋ชจ๋“  ์กฐํ•ฉ์ด ์žˆ๋‹ค. ์ด์ œ ์šฐ๋ฆฌ๋Š” $x_1$์— ๋Œ€ํ•œ Shapley Value๋ฅผ ๊ตฌํ•ด๋ณด์ž. 

 

์šฐ์„ ์ ์œผ๋กœ $x_1$ ๋ณ€์ˆ˜๋ฅผ ์‚ฌ์šฉํ–ˆ์„ ๋•Œ์˜ ์˜ˆ์ธก๊ฐ’๊ณผ $x_1$ ๋ณ€์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์ง€ ์•Š์•˜์„ ๋•Œ์˜ ์˜ˆ์ธก๊ฐ’ ๊ฐ„์˜ ์ฐจ์ด ๊ฐ’์„ ๊ณ„์‚ฐํ•˜๋ฉด์„œ ๋Œ€๋žต์ ์ธ $x_1$์˜ ๊ธฐ์—ฌ๋„๋ฅผ ๊ณ„์‚ฐํ•ด๋ณด์ž.

 

์„œ๋กœ ๊ฐ™์€ ์ƒ‰๊น”๋“ค๋ผ๋ฆฌ์˜ Case ๊ฐ„์˜ ์˜ˆ์ธก๊ฐ’์„ ๋นผ์ž.

 

์œ„ ์‚ฌ์ง„์—์„œ ๊ฐ™์€ ์ƒ‰๊น”์— ์†ํ•˜๋Š” Case๋“ค๋ผ๋ฆฌ ์˜ˆ์ธก๊ฐ’์„ ๋นผ๋ณด์ž. ์ž˜ ์‚ดํŽด๋ณด๋ฉด ๊ฐ™์€ ์ƒ‰๊น”๋“ค๋ผ๋ฆฌ ๋น„๊ตํ•ด๋ณด๋ฉด $x_1$ ๋ณ€์ˆ˜ ์‚ฌ์šฉ ์—ฌ๋ถ€์— ๋”ฐ๋ผ ์ง์ง€์–ด์ง€๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค. ๊ทธ๋ž˜์„œ ๊ณ„์‚ฐ์„ ํ•ด๋ณด๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™์•„์ง„๋‹ค.

 

  • Case 2 - Case 1 = 32 - 28 = 4
  • Case 5 - Case 3 = 32 - 31 = 1
  • Case 6 - Case 4 = 33 - 30 = 3
  • Case 8 - Case 7 = 35 - 32 = 3

์ด์ œ ์œ„ ๊ฒฐ๊ณผ๊ฐ’๋“ค์— ๋Œ€ํ•ด์„œ ๊ฐ€์ค‘์น˜๋ฅผ ๋ถ€์—ฌํ•ด์•ผ ํ•˜๋Š”๋ฐ, ๊ฐ€์ค‘์น˜๋Š” ๋ณ€์ˆ˜๋ฅผ ๋ช‡๊ฐœ ์‚ฌ์šฉํ•˜๋Š”์ง€์— ๋”ฐ๋ผ ๊ฒฝ์šฐ์˜ ์ˆ˜๋ฅผ ๋”ฐ์ง€๋ฉด์„œ ๋ถ€์—ฌํ•œ๋‹ค. ๋จผ์ € ์œ„ ๊ทธ๋ฆผ์—์„œ ํŒŒ๋ž€์ƒ‰ ๋„ค๋ชจ์นธ์ธ Case 1, Case 2์— ๋Œ€ํ•œ ๊ฐ€์ค‘์น˜๋ฅผ ๊ตฌํ•˜๊ธฐ ์œ„ํ•ด ๋ณ€์ˆ˜ 1๊ฐœ๋งŒ ์‚ฌ์šฉํ•œ ๊ฒฝ์šฐ์— ๋Œ€ํ•ด์„œ ์‚ดํŽด๋ณด์ž.

 

 

์œ„ ๊ทธ๋ฆผ์—์„œ ๋ณ€์ˆ˜๊ฐ€ ๋ฌด์—‡์ด ๋๊ฑด 1๊ฐœ๋งŒ์„ ์‚ฌ์šฉํ•œ ๊ฒฝ์šฐ๋Š” ์ฃผํ™ฉ์ƒ‰ ๋„ค๋ชจ์นธ์ฒ˜๋Ÿผ 3๊ฐœ์ด๊ณ  ๊ฐ ์ฃผํ™ฉ์ƒ‰ ๋„ค๋ชจ์นธ ๋งˆ๋‹ค ๋ณ€์ˆ˜๋ฅผ ์ œ๊ฑฐํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒฝ์šฐ๋Š” ๊ฐ 1๊ฐ€์ง€์”ฉ์ด๋ฏ€๋กœ ์ด ๊ฒฝ์šฐ์˜ ์ˆ˜๋Š” 3๊ฐ€์ง€๊ฐ€ ๋œ๋‹ค. ์ด ๋•Œ ์ด ๊ฒฝ์šฐ์˜ ์ˆ˜ 3๊ฐ€์ง€๋ฅผ ๋ถ„๋ชจ๋กœ ํ•œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์ด ์ค‘์— ์šฐ๋ฆฌ๊ฐ€ Shapley Value๋ฅผ ๊ตฌํ•˜๊ณ ์ž ํ•˜๋Š” $x_1$ ๋ณ€์ˆ˜๋ฅผ ์ œ๊ฑฐํ•œ ๊ฒฝ์šฐ๋Š” ๋ณด๋ผ์ƒ‰ ๋„ค๋ชจ์นธ์ธ 1๊ฐ€์ง€ ๋ฐ–์— ์—†๋‹ค. ๋”ฐ๋ผ์„œ ์ด์— ๋Œ€ํ•œ ๊ฐ€์ค‘์น˜๋Š” ${1 \over 3}$์ด ๋œ๋‹ค.

 

์ด์ œ ๋‹ค์Œ์œผ๋กœ Case 3 & Case 5 ์ธ ๊ฒฝ์šฐ์™€ Case 4 & Case 6 ์— ๋Œ€ํ•œ ๊ฐ€์ค‘์น˜๋ฅผ ๊ณ„์‚ฐํ•ด๋ณด์ž. ๋จผ์ € Case 3 & Case 5์— ๋Œ€ํ•ด ์‚ดํŽด๋ณด์ž.

 

 

๋ณ€์ˆ˜ 2๊ฐ€์ง€๋งŒ ์‚ฌ์šฉํ•œ ๊ฒฝ์šฐ๋“ค์€ ์œ„ ์ฃผํ™ฉ์ƒ‰ ๋ฐ•์Šค์ฒ˜๋Ÿผ 3๊ฐœ์ด๋‹ค.  ๊ทธ๋ฆฌ๊ณ  ๊ฐ ์ฃผํ™ฉ์ƒ‰ ๋„ค๋ชจ์นธ๋งˆ๋‹ค ๋ณ€์ˆ˜๋ฅผ ์ œ๊ฑฐํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒฝ์šฐ์˜ ์ˆ˜๋Š” ๊ฐ๊ฐ 2๊ฐ€์ง€์ด๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด Case 5๋ฒˆ์˜ ๊ฒฝ์šฐ $x_1$์„ ์ œ๊ฑฐํ•œ ๊ฒฝ์šฐ ๋˜๋Š” $x_2$๋ฅผ ์ œ๊ฑฐํ•œ ๊ฒฝ์šฐ ์ด 2๊ฐ€์ง€๊ฐ€ ๋‚˜์˜ค๊ฒŒ ๋œ๋‹ค. ๊ฒฐ๊ตญ ์ฃผํ™ฉ์ƒ‰ ๋ฐ•์Šค๊ฐ€ 3๊ฐœ ์ด๊ณ  ๊ฐ ๋ฐ•์Šค๋งˆ๋‹ค 2๊ฐ€์ง€์˜ ๊ฒฝ์šฐ์ˆ˜๊ฐ€ ๋‚˜์˜ค๋ฏ€๋กœ ์ด ๊ฒฝ์šฐ์˜ ์ˆ˜๋Š” 6๊ฐ€์ง€๊ฐ€ ๋œ๋‹ค. ์ด ๋•Œ ์ด ๊ฒฝ์šฐ์˜ ์ˆ˜ 6๊ฐ€์ง€๋ฅผ ๋ถ„๋ชจ๋กœ ํ•œ๋‹ค. ์ด์ œ 2๊ฐ€์ง€ ๋ณ€์ˆ˜๋ฅผ ์‚ฌ์šฉํ–ˆ์„ ๋•Œ ์šฐ๋ฆฌ๊ฐ€ ๊ตฌํ•˜๊ณ ์ž ํ•˜๋Š” $x_1$ ๋ณ€์ˆ˜๋ฅผ ์ œ๊ฑฐํ•œ ๊ฒฝ์šฐ๋Š” Case 3 1๊ฐ€์ง€ ๊ฒฝ์šฐ๋ฐ–์— ์กด์žฌํ•˜์ง€ ์•Š๋Š”๋‹ค. ๋”ฐ๋ผ์„œ Case 3 & Case 5์— ๋Œ€ํ•œ ๊ฐ€์ค‘์น˜๋Š” ${1 \over 6}$์ด ๋˜๊ฒŒ ๋œ๋‹ค. Case 4 & Case 6๋„ Case 3 & Case 5 ๊ฒฝ์šฐ์™€ ๋™์ผํ•˜๋ฏ€๋กœ ๋˜‘๊ฐ™์ด ๊ฐ€์ค‘์น˜๊ฐ€ ${1 \over 6}$์ด ๋œ๋‹ค.

 

์ด์ œ ๋งˆ์ง€๋ง‰์œผ๋กœ 3๊ฐœ์˜ ๋ณ€์ˆ˜ ๋ชจ๋‘ ์‚ฌ์šฉํ•œ ๊ฒฝ์šฐ๋ฅผ ์‚ดํŽด๋ณด์ž. 

 

 

์œ„ ๊ทธ๋ฆผ์ฒ˜๋Ÿผ ๋ณ€์ˆ˜ 3๊ฐ€์ง€๋ฅผ ๋ชจ๋‘ ์‚ฌ์šฉํ•œ ๊ฒฝ์šฐ๋Š” ์ฃผํ™ฉ์ƒ‰ ๋ฐ•์Šค 1๊ฐœ์ด๋ฉฐ ์ด ๋•Œ ๋ณ€์ˆ˜๋ฅผ 1๊ฐœ ์ œ๊ฑฐํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒฝ์šฐ๋Š” $x_1$์„ ์ œ๊ฑฐํ•˜๊ฑฐ๋‚˜ $x_2$๋ฅผ ์ œ๊ฑฐํ•˜๊ฑฐ๋‚˜ $x_3$๋ฅผ ์ œ๊ฑฐํ•˜๊ฑฐ๋‚˜ ์ด 3๊ฐ€์ง€์˜ ๊ฒฝ์šฐ๊ฐ€ ์žˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์šฐ๋ฆฌ๊ฐ€ ๊ตฌํ•˜๊ณ ์ž ํ•˜๋Š” ๋ณ€์ˆ˜ $x_1$๋ฅผ ์ œ๊ฑฐํ•œ ๊ฒฝ์šฐ๋Š” Case 7 ํ•œ ๊ฐ€์ง€ ๊ฒฝ์šฐ์ด๋ฏ€๋กœ ๊ฒฐ๊ตญ ๊ฐ€์ค‘์น˜๋Š” ${1 \over 3}$์ด ๋˜๊ฒŒ ๋œ๋‹ค.

 

์ตœ์ข…์ ์œผ๋กœ ๋งจ ์ฒ˜์Œ์— ๊ตฌํ–ˆ๋˜ ์˜ˆ์ธก ๊ฐ’ ์ฐจ์ด์— ๋Œ€ํ•ด ๋ฐฉ๊ธˆ๊นŒ์ง€ ๊ตฌํ–ˆ๋˜ ๊ฐ€์ค‘์น˜๋“ค์„ ๋งคํ•‘์‹œ์ผœ์„œ ๊ณฑํ•ด์ฃผ์–ด $x_1$ ๋ณ€์ˆ˜์— ๋Œ€ํ•œ Shapley Value๋ฅผ ๊ตฌํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด๋Ÿฐ ์‹์œผ๋กœ ๋‚˜๋จธ์ง€ ๋ณ€์ˆ˜ $x_2$, $x_3$์— ๋Œ€ํ•ด์„œ๋„ ๊ฐ๊ฐ ๊ตฌํ•ด์ฃผ๋ฉด ๋œ๋‹ค.

 

$x_1$์— ๋Œ€ํ•œ Shapley Value

 

์ฐธ๊ณ ๋กœ ๋ชจ๋“  ๋ณ€์ˆ˜์˜ Shapley Value ํ•ฉ์€ ๋ชจ๋“  ๋ณ€์ˆ˜๋ฅผ ์‚ฌ์šฉํ–ˆ์„ ๋•Œ์˜ ์˜ˆ์ธก๊ฐ’์—์„œ ์–ด๋–ค ๋ณ€์ˆ˜๋„ ์‚ฌ์šฉํ•˜์ง€ ์•Š์•˜์„ ๋•Œ์˜ ์˜ˆ์ธก๊ฐ’์„ ๋บ€ ๊ฒฐ๊ณผ๊ฐ’๊ณผ ๋™์ผํ•˜๊ฒŒ ๋œ๋‹ค.

 

Shapley Value๋ฅผ Python์œผ๋กœ ๊ตฌํ˜„ํ•˜๊ธฐ ์œ„ํ•ด ๋งŒ๋“ค์–ด์ง„ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๊ฐ€ ์กด์žฌํ•œ๋‹ค. ํ•ด๋‹น ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ํ†ตํ•ด ๋ณ€์ˆ˜๋ณ„ ์ค‘์š”๋„๋ฅผ ์ถœ๋ ฅํ•˜๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๊ทธ๋ž˜ํ”„๊ฐ€ ๋‚˜์˜ค๊ฒŒ ๋˜๋Š”๋ฐ ๊ฐ„๋‹จํ•˜๊ฒŒ ํ•ด์„ํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์ž. ์•„๋ž˜ ๋ฐ์ดํ„ฐ๋Š” ์œ ๋ช…ํ•œ ํƒ€์ดํƒ€๋‹‰ ์Šน๊ฐ ์‚ฌ๋ง ์˜ˆ์ธก์— ํ™œ์šฉ๋˜๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ–ˆ๋‹ค.

 

ํƒ€์ดํƒ€๋‹‰ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ Shapley Value ๊ฒฐ๊ณผ ๊ทธ๋ž˜ํ”„

 

์šฐ์„  ์™ผ์ชฝ ๊ทธ๋ฆผ์„ ์‚ดํŽด๋ณด์ž. ์™ผ์ชฝ ๊ทธ๋ฆผ์˜ Feature Value๋ผ๊ณ  ์“ฐ์—ฌ์ ธ ์žˆ๋Š” ๋ถ€๋ถ„์€ ๊ทธ์•ผ๋ง๋กœ Feature ์ž์ฒด์˜ ๊ฐ’์ด๋‹ค(๋ณ€์ˆ˜ ์ค‘์š”๋„ ๊ฐ’์ด ์•„๋‹˜์— ์ฃผ์˜!) ์ค‘์š”๋„ ๊ฐ’์€ ์™ผ์ชฝ ๊ทธ๋ฆผ์˜ X์ถ•์— SHAP value ๋ผ๊ณ  ์“ฐ์—ฌ์ ธ ์žˆ๋Š” ๋ถ€๋ถ„์ด๋‹ค. ์˜ˆ์‹œ๋ฅผ ํ•˜๋‚˜ ๋“ค์–ด๋ณด์ž. Sex ๋ผ๊ณ  ๋˜์–ด์žˆ๋Š” ์„ฑ๋ณ„์ด๋ผ๋Š” Feature๋ฅผ ์‚ดํŽด๋ณด์ž. ํƒ€์ดํƒ€๋‹‰ ๋ฐ์ดํ„ฐ์˜ Y๊ฐ’์€ 0์ด๋ฉด ์ƒ์กด, ์‚ฌ๋งํ–ˆ์œผ๋ฉด 1๋กœ ๋งคํ•‘๋˜์–ด ์žˆ๋‹ค. ์„ฑ๋ณ„์€ ์ฐธ๊ณ ๋กœ ๋ฒ”์ฃผํ˜• ๋ณ€์ˆ˜์ด๊ธฐ ๋•Œ๋ฌธ์— ํ•ด๋‹น ๊ทธ๋ž˜ํ”„์—์„œ๋Š” ํŒŒ๋ž€์ƒ‰ ๊ฐ’์ด ์—ฌ์„ฑ(0), ๋นจ๊ฐ„์ƒ‰ ๊ฐ’์ด ๋‚จ์„ฑ(1)๋กœ ๋˜์–ด์žˆ๋‹ค. ์ฆ‰, ๋‚จ์„ฑ์ผ ์ˆ˜๋ก ์‚ฌ๋ง(1) Y๊ฐ’์œผ๋กœ ๋‚ด๋ฑ‰๋Š” ๊ฒฝํ–ฅ์ด ๊ฐ•ํ•˜๋‹ค๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค. 

 

์ด๋ฒˆ์—” ์—ฐ์†ํ˜• ๋ณ€์ˆ˜์ธ Age๋ฅผ ์‚ดํŽด๋ณด์ž. ๋ช…ํ™•ํ•˜๊ฒŒ ๋‚˜๋‰˜์ง„ ์•Š์•˜์ง€๋งŒ Age ๊ฐ’์ด ๋†’์€ ๋นจ๊ฐ„์ƒ‰ ๊ฐ’๋“ค ์ฆ‰, ๋…ธ๋…„์ธต๋“ค์ด ์ƒ์กด์— ๋” ๊ฐ€๊น๊ณ  Age ๊ฐ’์ด ๋‚ฎ์€ ํŒŒ๋ž€์ƒ‰ ๊ฐ’๋“ค ์ฆ‰, ์ฒญ๋…„์ธต์ผ์ˆ˜๋ก ์ฃฝ์Œ์œผ๋กœ ๋‚˜์˜ค๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค.

 

์ด์ œ ๊ทธ๋ฆผ์˜ ์˜ค๋ฅธ์ชฝ ๊ทธ๋ž˜ํ”„์„ ์‚ดํŽด๋ณด์ž. ์ด๋Š” ํ”ํ•˜๊ฒŒ ์ ‘ํ–ˆ๋˜ Tree-based ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ Feature Importance ๊ฐ™์€ ๊ทธ๋ž˜ํ”„์™€ ๋น„์Šทํ•œ ์˜๋ฏธ๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค. ์ฆ‰, ์™ผ์ชฝ ๊ทธ๋ž˜ํ”„๋Š” ํ•˜๋‚˜์˜ ๊ด€์ธก์น˜ ๋งˆ๋‹ค์˜ ์ „์ฒด ๋ณ€์ˆ˜์˜ ์ค‘์š”๋„๋ฅผ ๊ฐ ๋‚˜ํƒ€๋‚ธ ๊ฒƒ์ด๋ผ๋ฉด ์˜ค๋ฅธ์ชฝ ๊ทธ๋ฆผ์€ ์ „์ฒด ๊ด€์ธก์น˜์— ๋Œ€ํ•ด์„œ ์ „์ฒด ๋ณ€์ˆ˜์˜ ์ „๋ฐ˜์ ์ธ ์ค‘์š”๋„ ๊ฐ’์„ ๋‚˜ํƒ€๋‚ธ ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค. ๊ทธ๋ž˜ํ”„๋ฅผ ์‚ดํŽด๋ณด๋ฉด Sex(์„ฑ๋ณ„), Age(์—ฐ๋ น)๊ฐ€ ์ฃผ๋กœ ์˜ˆ์ธก๋ ฅ์— ๋งŽ์ด ๊ธฐ์—ฌํ•œ ๋ณ€์ˆ˜๋ผ๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค.


์ง€๊ธˆ๊นŒ์ง€ ์„ค๋ช…๊ฐ€๋Šฅํ•œ AI(XAI)๋ฅผ ๋งŒ๋“ค๊ธฐ ์œ„ํ•œ ํ•˜๋‚˜์˜ ๋ฐฉ๋ฒ•์œผ๋กœ์„œ Shapley Value๋ฅผ ๊ตฌํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์•˜๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ Shapley Value๊ฐ€ ๊ฐ–๋Š” ์žฅ, ๋‹จ์ ์— ๋Œ€ํ•ด ์ด์•ผ๊ธฐํ•˜๊ณ  ๊ธ€์„ ๋งˆ์น˜๋ ค ํ•œ๋‹ค.

 

๋จผ์ € LIME ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ๋Š” ๋‹ฌ๋ฆฌ ๋ชจ๋“  ํ•™์Šต ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์˜ˆ์ธก๊ฐ’์„ ๊ธฐ์ค€์œผ๋กœ ์‹œ์ž‘์„ ํ•˜๊ฒŒ ๋˜์„œ ๋ชจ๋“  ๋ฐ์ดํ„ฐ ์ค‘ ๊ด€์‹ฌ์žˆ๋Š” ๊ด€์ธก์น˜์˜ ์œ„์น˜๋ฅผ ํŒŒ์•…ํ•˜๊ณ  ํ•ด์„ํ•  ์ˆ˜ ์žˆ๋‹ค. ๋˜ํ•œ ์ •ํ˜• ๋ฐ์ดํ„ฐ์˜ ๊ฒฝ์šฐ, ๊ด€์ธก์น˜ ๋ณ„ ํ•ด์„๊ณผ ์ „๋ฐ˜์  ๋ณ€์ˆ˜ ์ค‘์š”๋„๋ฅผ ์‚ฐ์ถœ์ด ๊ฐ€๋Šฅํ•˜๋‹ค(๋ฐ”๋กœ ์œ„์—์„œ Shapley Value ๊ทธ๋ž˜ํ”„ 2๊ฐœ๋ฅผ ์‚ดํŽด๋ณด์•˜๋“ฏ์ด). ์ด๊ฑด ์žฅ์ ์ด๋ผ๊ณ  ํ•˜๊ธฐ์—๋Š” ์• ๋งคํ•  ์ˆ˜ ์žˆ์ง€๋งŒ ์–ด๋–ค ์˜ˆ์ธก ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์— ์ƒ๊ด€์—†์ด ๋ชจ๋‘ Shapley Value ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด๋ฅผ Model-Agnostic ์ด๋ผ๊ณ ๋„ ํ•œ๋‹ค.(Agnostic์ด ~์— ๊ด€๊ณ„์—†์ด ๋ผ๋Š” ์˜๋ฏธ๋ผ๊ณ  ํ•œ๋‹ค)

 

๋ฐ˜๋ฉด, Shapley Value๋Š” ์œ„ ์˜ˆ์‹œ์—์„œ๋„ ์‚ดํŽด๋ณด์•˜์ง€๋งŒ 3๊ฐœ์˜ ๋ณ€์ˆ˜๋งŒ ์žˆ์–ด๋„ 8๊ฐœ์˜ ๊ฒฝ์šฐ์˜ ์ˆ˜๊ฐ€ ๋‚˜์˜ค๊ฒŒ ๋œ๋‹ค. ๋”ฐ๋ผ์„œ ๋ณ€์ˆ˜์˜ ๊ฐœ์ˆ˜๊ฐ€ ๋Š˜๋ฉด ๋ชจ๋“  ๊ฒฝ์šฐ์˜ ์ˆ˜๊ฐ€ ๊ธฐํ•˜๊ธ‰์ˆ˜์ ์œผ๋กœ ์ฆ๊ฐ€ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋งŽ์€ ์ปดํ“จํŒ… ๋น„์šฉ์ด ์š”๊ตฌ๋œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  Shapley Value๋Š” ๋ชจ๋ธ์„ ๋ชจ๋‘ ํ•™์Šตํ•˜๊ณ  ํ‰๊ฐ€ํ•œ ํ›„์— ์ˆ˜ํ–‰ํ•˜๋Š” ์‚ฌํ›„๋ถ„์„์˜ ๋ฐฉ๋ฒ• ์ค‘ ํ•˜๋‚˜๋กœ์„œ Shapley Value ๊ฒฐ๊ณผ๋งŒ์œผ๋กœ ์–ด๋–ค ๋ณ€์ˆ˜๋กœ ์ธํ•ด ์–ด๋–ค ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์™”๋‹ค๋Š” ์ธ๊ณผ๊ด€๊ณ„๋ฅผ ์ •๋ฆฝ์‹œํ‚ฌ ์ˆ˜ ์—†๋‹ค.(๋ฌผ๋ก  ์˜ˆ์ธก๋ ฅ์— ์ฃผ์š”ํ•˜๊ฒŒ ๊ธฐ์—ฌํ•œ ๊ฒƒ์€ ๋งž์ง€๋งŒ ์ด๋ฅผ ์ผ๋ฐ˜ํ™”์‹œํ‚ฌ ์ˆ˜๋Š” ์—†๋‹ค)

๋ฐ˜์‘ํ˜•