๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

Data Science/Computer Vision

[ML] Object Detection ๊ธฐ์ดˆ ๊ฐœ๋…๊ณผ ์„ฑ๋Šฅ ์ธก์ • ๋ฐฉ๋ฒ•

๋ฐ˜์‘ํ˜•

๐Ÿ”Š ํ•ด๋‹น ํฌ์ŠคํŒ…์—์„œ ์‚ฌ์šฉ๋œ ์ปจํ…์ธ ๋Š” ์ธํ”„๋Ÿฐ์˜ ๋”ฅ๋Ÿฌ๋‹ ์ปดํ“จํ„ฐ ๋น„์ „ ์™„๋ฒฝ ๊ฐ€์ด๋“œ ๊ฐ•์˜ ๋‚ด์šฉ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ–ˆ์Œ์„ ์•Œ๋ฆฝ๋‹ˆ๋‹ค. ์„ค๋ช…์—์„œ ์‚ฌ์šฉ๋œ ์ž๋ฃŒ๋Š” ์ตœ๋Œ€ํ•œ ์ œ๊ฐ€ ์ง์ ‘ ์žฌ๊ตฌ์„ฑํ•œ ์ž๋ฃŒ์ž„์„ ์•Œ๋ฆฝ๋‹ˆ๋‹ค.

 

์ตœ๊ทผ์— ์ธํ”„๋Ÿฐ์—์„œ ๊ถŒ์ฒ ๋ฏผ ๋‹˜์˜ '๋”ฅ๋Ÿฌ๋‹ ์ปดํ“จํ„ฐ ๋น„์ „ ์™„๋ฒฝ ๊ฐ€์ด๋“œ'๋ผ๋Š” ๊ฐ•์˜๋ฅผ ๋“ฃ๊ธฐ ์‹œ์ž‘ํ–ˆ๋‹ค. ํ•ด๋‹น ๊ฐ•์˜๋Š” ์ปดํ“จํ„ฐ ๋น„์ „(Computer Vision)์˜ Object Detecion ๊ณผ Segmentation ๋‚ด์šฉ์— ํฌ์ปค์Šค๋ฅผ ๋งž์ถ”๊ณ  ์žˆ๋‹ค. ์›๋ž˜ ๊ด€์‹ฌ ๋ถ„์•ผ๊ฐ€ ์ปดํ“จํ„ฐ ๋น„์ „์€ ์•„๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ถ„์•ผ๋ฅผ ๊ณต๋ถ€ํ•˜๊ฒŒ ๋˜๋ฉด ๋ˆ„๊ตฌ๋‚˜ ๋”ฅ๋Ÿฌ๋‹์„ ๋งˆ์ฃผํ•˜๊ฒŒ ๋˜๊ณ  ๋”ฅ๋Ÿฌ๋‹์„ ์กฐ๊ธˆ ๋“ค์—ฌ๋‹ค ๋ณด๋ฉด ์ปดํ“จํ„ฐ ๋น„์ „์— ์ •๋ง ์ž˜ ์‚ฌ์šฉ๋˜๊ณ  ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค. ํ˜„์žฌ ์ ์  ์ƒ์šฉํ™”๋˜๊ณ  ์žˆ๋Š” ์ž์œจ ์ฃผํ–‰๋„ ์ด ์ปดํ“จํ„ฐ ๋น„์ „์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋งŒ๋“ค์–ด์ง„ ๊ธฐ๋Šฅ์ด๋‹ค.

 

๋ฌผ๋ก  ํ˜„์žฌ ์ปดํ“จํ„ฐ ๋น„์ „ ๋ถ„์•ผ๋ฅผ ๊นŠ๊ฒŒ ํŒŒ์„œ ์ด ์ชฝ์œผ๋กœ ๋ฐ”๋กœ ์ทจ์—…ํ•˜๊ณ  ์‹ถ์€ ์ƒ๊ฐ์€ ์•„๋‹ˆ์ง€๋งŒ ํ•„์ž๊ฐ€ ๋‚˜์ค‘์— ์–ด๋””์„œ ์ผํ•˜๊ฒŒ ๋ ์ง€ ๋ชจ๋ฅด๊ณ  ๋˜ ์ผํ•˜๊ฒŒ ๋˜์„œ ์ปดํ“จํ„ฐ ๋น„์ „๊ณผ ๊ด€๋ จ๋œ ์—…๋ฌด๋ฅผ ๋งก์„์ง€๋„ ๋ชจ๋ฅด๊ธฐ ๋•Œ๋ฌธ์— ์ง€๊ธˆ์€ ํฅ๋ฏธ๋ฅผ ๋‹์šฐ๊ณ  ๊ธฐ์ดˆ ๊ฐœ๋…์„ ์Œ“๊ณ ์ž ๊ณต๋ถ€ํ•˜๋ ค๊ณ  ํ•œ๋‹ค.


Object Detecion๊ณผ Segmentation์„ ๋ฐฐ์šฐ๊ธฐ ์ „ CNN(Convolutional Neural Network)์— ๋Œ€ํ•ด ์•Œ๊ณ  ์žˆ์–ด์•ผ ํ•˜๋Š”๋ฐ, ๋งŒ์•ฝ ์ด๋ฅผ ๋ชจ๋ฅธ๋‹ค๋ฉด ์—ฌ๊ธฐ๋ฅผ ์ฐธ๊ณ ํ•ด ๋ฐฐ์šฐ๊ณ  ์˜ค๋„๋ก ํ•˜์ž.

 

์‚ฌ๋žŒ ์–ผ๊ตด์ด๋ผ๋Š” Object๋ฅผ ์–ด๋–ป๊ฒŒ Detection(๊ฐ์ง€)ํ• ๊นŒ?

 

์ด๋ฒˆ ํฌ์ŠคํŒ…์—์„œ๋Š” Object Detection ๋˜๋Š” Segmentation๋ฅผ ์ˆ˜ํ–‰ํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์— ๋Œ€ํ•œ ๋‚ด์šฉ๋ณด๋‹ค๋Š” ๊ธฐ๋ณธ ๊ฐœ๋…์— ๋Œ€ํ•ด ๋‹ค๋ฃจ๋ ค๊ณ  ํ•œ๋‹ค. ์ด ๊ฐœ๋…๋“ค์„ ์ตํ˜€์•ผ ์ถ”ํ›„์— ์†Œ๊ฐœ๋  ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ๋“ค์— ๋Œ€ํ•ด ์ดํ•ด๊ฐ€ ์ˆ˜์›”ํ•  ๊ฒƒ์ด๋‹ค. ์•ž์œผ๋กœ ์†Œ๊ฐœํ•  ๋ชฉ์ฐจ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. 

 

1. Localization? Detection? Segmentation?

2. ๋ถ„๋ฅ˜ ๋ฌธ์ œ? ํšŒ๊ท€ ๋ฌธ์ œ?

3. Region Proposal

4. Object Detection ์•„ํ‚คํ…์ฒ˜

5. Detection ์„ฑ๋Šฅ ํ‰๊ฐ€ Metrics

1. Localization? Detection? Segmentation?

์šฐ์„  Object ๋ผ๋Š” ๊ฐ์ฒด๋ฅผ ํƒ์ง€ํ•˜๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ๋Š” ํฌ๊ฒŒ 3๊ฐ€์ง€๊ฐ€ ์กด์žฌํ•œ๋‹ค. ๋ฐ”๋กœ Localization, Detection, Segmentation์ด๋‹ค. ์ด๋“ค์˜ ์ฐจ์ด์ ์„ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•ด ๋‹ค์Œ ์‚ฌ์ง„์„ ์‚ดํŽด๋ณด์ž.

 

3๊ฐ€์ง€ ํƒ์ง€ ๋ฐฉ๋ฒ•์˜ ์ฐจ์ด

 

์œ„ ๊ทธ๋ฆผ์˜ ๊ฐ€์žฅ ์™ผ์ชฝ๋ถ€ํ„ฐ ํ•˜๋‚˜์”ฉ ์‚ดํŽด๋ณด์ž.

 

  • Classification : ํŠน์ • ์ด๋ฏธ์ง€๊ฐ€ ์–ด๋–ค ๊ฐ์ฒด์ธ์ง€, ์˜ˆ๋ฅผ ๋“ค๋ฉด ๊ณ ์–‘์ด์ธ์ง€ ๊ฐ•์•„์ง€์ธ์ง€, ์‚ฌ๋žŒ์ธ์ง€, ์ž๋™์ฐจ์ธ์ง€ ๋“ฑ ๊ฐ์ฒด์˜ ํด๋ž˜์Šค๋งŒ์„ ๋ถ„๋ฅ˜ํ•œ๋‹ค. ์ด ๋•Œ ์ฃผ๋กœ CNN ๋ชจ๋ธ๋งŒ์„ ์‚ฌ์šฉํ•œ๋‹ค.
  • Classification + Localization : Localization์ด๋ž€, ๋‹จ 1๊ฐœ์˜ ๊ฐ์ฒด ์œ„์น˜๋ฅผ ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค(Bounding Box)๋กœ ์ง€์ •ํ•ด ์ฐพ๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค. ์œ„ ๊ทธ๋ฆผ์ฒ˜๋Ÿผ ๊ณ ์–‘์ด ์ฃผ๋ณ€์— ์‚ฌ๊ฐํ˜•์œผ๋กœ ๋ฐ•์Šค๊ฐ€ ์”Œ์›Œ์ ธ ์žˆ๋Š” ๊ฒƒ์„ ๋ณผ ์ˆ˜ ์žˆ๋‹ค.
  • Object Detection : ์—ฌ๋Ÿฌ๊ฐœ์˜ ๊ฐ์ฒด๋“ค์— ๋Œ€ํ•œ ์œ„์น˜๋ฅผ ์—ฌ๋Ÿฌ๊ฐœ์˜ ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค๋กœ ์ง€์ •ํ•ด์„œ ์ฐพ๋Š”๋‹ค. ์ด ๋•Œ ๋™์‹œ์— ์—ฌ๋Ÿฌ๊ฐœ์˜ ๊ฐ์ฒด๋“ค์ด ๋ฌด์—‡์„ ์˜๋ฏธํ•˜๋Š”์ง€ ํด๋ž˜์Šค ๋ถ„๋ฅ˜๋„ ์ˆ˜ํ–‰ํ•œ๋‹ค.
  • Segmentation : Pixel-level๋กœ Object Detection์„ ํ•˜๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค. ๊ทธ๋ฆผ์—์„œ Object Detection์ผ ๋•Œ์˜ ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค์™€ ๋น„๊ตํ•ด๋ณด๋ฉด ์‹œ๊ฐ์ ์œผ๋กœ ์ฐจ์ด์ ์ด ๋ฌด์—‡์ธ์ง€ ํ™•์—ฐํžˆ ์•Œ ์ˆ˜ ์žˆ๋‹ค.

2. ๋ถ„๋ฅ˜ ๋ฌธ์ œ? ํšŒ๊ท€ ๋ฌธ์ œ?

(์•ž์œผ๋กœ Localization, Object Detection, Segmentation ๋ชจ๋‘ ๊ทธ๋ƒฅ ๊ฐ์ฒด ํƒ์ง€๋ผ๊ณ  ๋ถ€๋ฅด๊ฒ ์Šต๋‹ˆ๋‹ค!)

๊ทธ๋ ‡๋‹ค๋ฉด ๊ฐ์ฒด ํƒ์ง€ ๋ฐฉ๋ฒ•์€ ๋จธ์‹ ๋Ÿฌ๋‹์—์„œ ์–ด๋–ค ๋ฌธ์ œ์ผ๊นŒ? ์–ด๋–ค ๋ฌธ์ œ๋ผ ํ•จ์€ ํด๋ž˜์Šค๋ฅผ '๋ถ„๋ฅ˜'ํ•˜๋Š” ๋ฌธ์ œ์ธ์ง€, ์•„๋‹ˆ๋ฉด ์‹ค์ˆ˜๊ฐ’์„ ์˜ˆ์ธกํ•˜๋Š” 'ํšŒ๊ท€' ๋ฌธ์ œ์ธ์ง€๋ฅผ ๋งํ•œ๋‹ค. ๊ฐ์ฒด ํƒ์ง€๋Š” '๋ถ„๋ฅ˜ + ํšŒ๊ท€' ๋ฌธ์ œ๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๋‹ค. 1๋ฒˆ ๋ชฉ์ฐจ์—์„œ๋„ ์ž ์‹œ ์–ธ๊ธ‰ํ–ˆ์ง€๋งŒ ๊ฐ์ฒด์˜ ํด๋ž˜์Šค๋ฅผ '๋ถ„๋ฅ˜' ํ•˜๊ณ  ๋™์‹œ์— ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค๋ฅผ ์ฐพ๋Š” 'ํšŒ๊ท€' ๋ฌธ์ œ๋ฅผ ํ•จ๊ป˜ ์ˆ˜ํ–‰ํ•œ๋‹ค.

 

๊ฐ์ฒด ํƒ์ง€๋Š” ๋ถ„๋ฅ˜์™€ ํšŒ๊ท€ ๋ฌธ์ œ๋ฅผ ๋™์‹œ์— ์ˆ˜ํ–‰ํ•œ๋‹ค.

3. Region Proposal

Region Proposal์€ ์‰ฝ๊ฒŒ ๋งํ•ด์„œ ๊ฐ์ฒด๊ฐ€ ์žˆ์„ ๋งŒํ•œ ์˜์—ญ๋“ค์˜ ํ›„๋ณด๊ตฐ๋“ค์„ ์—ฌ๋Ÿฌ๊ฐœ ์ถ”์ถœํ•ด์ฃผ๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค. ๋Œ€๋ถ€๋ถ„์˜ ์ด๋ฏธ์ง€๋“ค์˜ ๋ชจ๋“  ํ”ฝ์…€๋“ค์ด ๊ฐ์ฒด๋ฅผ ์„ค๋ช…ํ•˜๊ณ  ์žˆ์ง€ ์•Š๋‹ค. ์ฆ‰, ์–ด๋–ค ๋ถ€๋ถ„๋“ค์˜ ๋ฐฐ๊ฒฝ ํ”ฝ์…€๋“ค์ด ์žˆ๊ณ , ์–ด๋–ค ๋ถ€๋ถ„์€ ๊ฐ์ฒด๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ํ”ฝ์…€๋“ค์ด ์žˆ๋‹ค. ๊ทธ๋Ÿฐ๋ฐ ๊ฐ์ฒด๋ฅผ ํƒ์ง€ํ•˜๊ธฐ ์œ„ํ•ด์„œ ๋ฐฐ๊ฒฝ์˜ ํ”ฝ์…€๋“ค์€ ์‚ฌ์‹ค์ƒ ํ•„์š”๊ฐ€ ์—†๋‹ค. ๋”ฐ๋ผ์„œ ๊ฐ์ฒด๋“ค์„ ๋‚˜ํƒ€๋‚ด๋Š” ํ”ฝ์…€๋“ค๋งŒ์„ ์ฐพ๊ณ  ํƒ์ง€ํ•˜๊ธฐ ์œ„ํ•ด Region Proposal์ด ๊ฐ์ฒด๊ฐ€ '์žˆ์„ ๋ฒ•ํ•œ' ํ”ฝ์…€์˜ ์˜์—ญ๋“ค์„ ๋Œ€๊ฑฐ ์ถ”์ถœํ•ด ์ถ”์ฒœํ•ด์ฃผ๋Š” ๋ฐฉ์‹์ด๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค.

 

Region Proposal์—๋Š” ํฌ๊ฒŒ 2๊ฐ€์ง€ ๋ฐฉ๋ฒ•์ด ์กด์žฌํ•œ๋‹ค. ๋จผ์ € Sliding Window์— ๋Œ€ํ•ด์„œ ์•Œ์•„๋ณด์ž.

3-1. Sliding Window

์Šฌ๋ผ์ด๋”ฉ ์œˆ๋„์šฐ๋Š” ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ๋ฅผ ๊ต์ฐจ ๊ฒ€์ฆํ•  ๋•Œ ์‚ฌ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋ผ๊ณ  ์•Œ๊ณ  ๊ณ„์‹  ๋ถ„๋“ค๋„ ์žˆ์„ ๊ฒƒ์ด๋‹ค. ํ•˜์ง€๋งŒ Region Proposal์—๋„ ์Šฌ๋ผ์ด๋”ฉ ์œˆ๋„์šฐ ๊ธฐ๋ฒ•์ด ์žˆ๋Š”๋ฐ ์ ์šฉ ๋ถ„์•ผ์—๋งŒ ๋‹ค๋ฅผ ๋ฟ์ด์ง€ ๊ทผ๋ณธ์ ์œผ๋กœ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฐฉ๋ฒ•์€ ๋น„์Šทํ•˜๋‹ค. ์šฐ์„  ๊ทธ๋ฆผ์„ ๋ณด์ž.

 

Sliding Window ์ˆ˜ํ–‰ ๋ฐฉ๋ฒ•

 

์œ„์™€ ๊ฐ™์ด ํŠน์ •ํ•œ ๋ชจ์–‘์˜ ์œˆ๋„์šฐ๋ฅผ ์ด๋ฏธ์ง€ ์™ผ์ชฝ ์ƒ๋‹จ์—์„œ ์˜ค๋ฅธ์ชฝ ํ•˜๋‹จ์œผ๋กœ ์ ์ง„์ ์œผ๋กœ ์ด๋™ํ•˜๋ฉด์„œ ๊ฐ์ฒด๊ฐ€ ์žˆ์„ ๋งŒํ•œ Region๋“ค์„ Proposal(์ œ์•ˆ)ํ•ด์ฃผ๋Š” ๊ฒƒ์ด๋‹ค. ๋ฌผ๋ก  ํŠน์ •ํ•œ ๋ชจ์–‘์œผ๋กœ ์œˆ๋„์šฐ๋งŒ์„ ์ด์šฉํ•  ์ˆ˜ ์žˆ์ง€๋งŒ ์‘์šฉํ•˜์—ฌ ๊ฐ๊ธฐ ๋‹ค๋ฅธ ๋ชจ์–‘์˜ ์œˆ๋„์šฐ๋ฅผ ๊ฐ๊ฐ ์Šฌ๋ผ์ด๋”ฉํ•˜๊ฑฐ๋‚˜ ์•„๋‹ˆ๋ฉด ์œˆ๋„์šฐ ํฌ๊ธฐ๋ฅผ ๊ณ ์ •ํ•˜๋˜ ํƒ์ง€ํ•  ์ด๋ฏธ์ง€ ํฌ๊ธฐ๋ฅผ ๋‹ค์–‘ํ•˜๊ฒŒ ์Šค์ผ€์ผ๋งํ•ด์„œ Region Proposal์„ ์ˆ˜ํ–‰ํ•˜๊ธฐ๋„ ํ•œ๋‹ค.

 

ํ•˜์ง€๋งŒ ์Šฌ๋ผ์ด๋”ฉ ์œˆ๋„์šฐ๋Š” ์น˜๋ช…์ ์ธ ๋‹จ์ ์ด ์žˆ๋‹ค. ๋ฐ”๋กœ ๊ฐ์ฒด๊ฐ€ ์—†๋Š” ์ง€์—ญ๋„ ์Šฌ๋ผ์ด๋”ฉ์„ ๋ฌด์กฐ๊ฑด ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์Šฌ๋ผ์ด๋”ฉ ์œˆ๋„์šฐ๋ฅผ ํ•˜๋Š” ๋ฐ ์‹œ๊ฐ„์ด ๋งŽ์ด ๊ฑธ๋ฆด ๋ฟ๋”๋Ÿฌ ๊ฐ์ฒด๋ฅผ ์ž˜ ํƒ์ง€ํ•  ํ™•๋ฅ ๋„ ๋‚ฎ์•„์ง€๊ฒŒ ๋œ๋‹ค. ์œ„ ์‚ฌ์ง„์—์„œ ๊ฒ€์€ ์ƒ‰ ๋ฐฐ๊ฒฝ๋“ค๋„ ์Šฌ๋ผ์ด๋”ฉ ํ•˜๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๋ง์ด๋‹ค.

3-2. Selective Search

์Šฌ๋ผ์ด๋”ฉ ์œˆ๋„์šฐ ๊ธฐ๋ฒ•์˜ ํ•œ๊ณ„์ ์„ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด ์ œ์•ˆ๋œ ๋ฐฉ๋ฒ•์ด Selective Search ๋ฐฉ๋ฒ•์ด๋‹ค. Selective Search๋ž€, ์ผ์ข…์˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ์ด๋ฏธ์ง€ ํ”ฝ์…€์˜ ์ปฌ๋Ÿฌ, ๋ฌด๋Šฌ, ํฌ๊ธฐ, ํ˜•ํƒœ์— ๋”ฐ๋ผ ์œ ์‚ฌํ•œ Region์„ ๊ณ„์ธต์  ๊ทธ๋ฃนํ•‘ ๋ฐฉ๋ฒ•์œผ๋กœ ๊ณ„์‚ฐํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค. ์ฆ‰, ๊ฐ์ฒด๊ฐ€ ๋“ค์–ด์žˆ์„ ๋งŒํ•œ ์—ฌ๋Ÿฌ๊ฐœ์˜ ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค๋ฅผ ๋งŒ๋“ค๊ณ  ๋ฐ˜๋ณต์ ์œผ๋กœ Selective Search ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ด์šฉํ•ด ์ตœ์ ์˜ ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค๋ฅผ ์„ ์ •ํ•ด Region Proposal์„ ํ•ด์ฃผ๋Š” ๊ฒƒ์ด๋‹ค. ๋‹ค์Œ ๊ทธ๋ฆผ์„ ๋ณด์ž.

 

Selective Search ์ˆ˜ํ–‰ ๊ณผ์ •

 

์œ„ ๊ทธ๋ฆผ์˜ ๊ฐ€์žฅ ์™ผ์ชฝ์ธ ์ธํ’‹ ์ด๋ฏธ์ง€๋ฅผ Selective Search ์ˆ˜ํ–‰ํ•˜๋ฉด ์˜ค๋ฅธ์ชฝ ๊ทธ๋ฆผ์ฒ˜๋Ÿผ ๊ตฌ๋ถ„์ด ๊ฐ์ฒด๊ฐ€ ์žˆ๋Š” ๊ตฌ์—ญ์„ ๊ธฐ์ค€์œผ๋กœ ์ž˜ ๋ถ„ํ• ๋˜๋Š” ๊ฒƒ์„ ๋ณผ ์ˆ˜ ์žˆ๋‹ค. ๋ฐฉ๊ธˆ๋„ ์–ธ๊ธ‰ํ–ˆ๋‹ค์‹œํ”ผ Selective Search๋Š” ์ดˆ๊ธฐ์— ํ”ฝ์…€ ๊ฐœ๋ณ„๋กœ Segmentation๋œ ๋ถ€๋ถ„์„ ์œ ์‚ฌ๋„์— ๋”ฐ๋ผ Segmentation ๊ทธ๋ฃนํ•‘์„ ๊ณ„์† ๋ฐ˜๋ณตํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ๋”ฐ๋ผ์„œ Selective Search๋Š” ์œ„ ๊ทธ๋ฆผ์—์„œ 'After more iterations'์— ํ•ด๋‹นํ•˜๋Š” ๋ถ€๋ถ„์„ Region Proposal ํ•ด์ฃผ๊ฒŒ ๋œ๋‹ค.

4. Object Detection ์•„ํ‚คํ…์ฒ˜

์ด์ œ ์ค‘๊ฐ„ ์ ๊ฒ€(?)์œผ๋กœ ์ง€๊ธˆ๊นŒ์ง€ ๋ฐฐ์šด ๊ฐœ๋…์„ ์‚ฌ์šฉํ•ด Object Detection์ด ์–ด๋–ค ์•„ํ‚คํ…์ฒ˜์™€ ํ”„๋กœ์„ธ์Šค๋กœ ์ „๊ฐœ๋˜๋Š”์ง€ ๊ทธ๋ฆผ์œผ๋กœ ์‚ดํŽด๋ณด์ž.

 

Object Detection ์•„ํ‚คํ…์ฒ˜

 

์ถ”ํ›„ ๊ฒŒ์‹œํ•  ํฌ์ŠคํŒ…์—์„œ ์†Œ๊ฐœํ•˜๊ฒ ์ง€๋งŒ 3๋ฒˆ ๋ชฉ์ฐจ์—์„œ ๋ฐฐ์šด Region Proposal์€ Object Detection Network(e.g RCNN, Fast RCNN, SSP ๋“ฑ)์—์„œ Feature Map๊ณผ ์ ์ ˆํžˆ ๋งคํ•‘์„ ์ด๋ฃจ๊ฒŒ ๋œ๋‹ค.(์ด๋ฅผ ROI = Regions Of Interest, ๊ด€์‹ฌ๋งŒ ์žˆ๋Š” ์˜์—ญ ์ด๋ผ๊ณ ๋„ ํ•œ๋‹ค.)

5. Detection ์„ฑ๋Šฅ ํ‰๊ฐ€ Metrics

4๋ฒˆ ๋ชฉ์ฐจ๊นŒ์ง€ ํ•ด์„œ ๊ฐ์ฒด ํƒ์ง€ ๋ชจ๋ธ์ด ์–ด๋–ค ์‹์œผ๋กœ ๊ตฌ์„ฑ๋˜๋Š”์ง€ ๋Œ€๋žต ์•Œ๊ฒŒ๋˜์—ˆ๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด ์ด๋ ‡๊ฒŒ ๋งŒ๋“  ๊ฐ์ฒด ํƒ์ง€ ๋ชจ๋ธ์ด ์–ผ๋งˆ๋‚˜ ์ž˜ ๊ฐ์ฒด๋ฅผ ํƒ์ง€ํ•˜๋Š”์ง€ ํƒ์ง€ ์„ฑ๋Šฅ์„ ํŒ๋‹จํ•˜๋Š” ์ฒ™๋„๋Š” ๋ฌด์—‡์œผ๋กœ ํ• ๊นŒ?

5-1. IoU(Intersection Over Union)

๊ณ ๋“ฑํ•™๊ต ์‹œ์ ˆ, ์ง‘ํ•ฉ ๋‹จ์›์—์„œ ๊ต์ง‘ํ•ฉ, ํ•ฉ์ง‘ํ•ฉ์— ๋Œ€ํ•ด ๋ฐฐ์› ์„ ๊ฒƒ์ด๋‹ค. IoU๋Š” ๊ทธ ๊ฐœ๋…๋“ค์„ ๋„์ž…ํ•œ ๊ฒƒ์ด๋‹ค. ์ฆ‰, ์‹ค์ œ ๊ฐ์ฒด๊ฐ€ ์žˆ๋Š” ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค(Ground Truth)์™€ ๋ชจ๋ธ์ด ์˜ˆ์ธกํ•œ ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค(Predicted)๊ฐ€ ํฌํ•จํ•˜๊ณ  ์žˆ๋Š” ์˜์—ญ์„ ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ๋‹ค. ๋‹ค์Œ ๊ทธ๋ฆผ์„ ๋ณด์ž.

 

IoU ๊ณ„์‚ฐ ๋ฐฉ์‹

 

์ฃผ์˜ํ•ด์•ผ ํ•  ์ ์€ Area of Union ๊ฐ’์„ ๊ตฌํ•  ๋•Œ Ground Truth ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค์™€ Predicted ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค ๋„“์ด ๋‘๊ฐœ๋ฅผ ๋”ํ•ด์ฃผ๊ณ  Area of Overlap ๋ถ€๋ถ„์„ 1๋ฒˆ ๋นผ์ฃผ์–ด์•ผ ํ•œ๋‹ค.(์—ฌ๋‹ด์ด์ง€๋งŒ ์ด๋Ÿฌํ•œ ์‹ค์ˆ˜๋ฅผ ๊ณ ๋“ฑํ•™๊ต ์‹œ์ ˆ ๋ช‡ ๋ฒˆ ํ–ˆ๋˜ ๊ฒฝํ—˜์ด ์–ด๋ ดํ’‹์ด ๋‚œ๋‹ค..๐Ÿ˜จ)

 

IoU๊ฐ’์€ ๋น„์œจ์ด๊ธฐ ๋•Œ๋ฌธ์— 0๊ณผ 1์‚ฌ์ด์˜ ๊ฐ’์œผ๋กœ ๋‚˜์˜ค๊ฒŒ ๋œ๋‹ค. ๊ฐ’์ด 1๋กœ ๊ฐˆ์ˆ˜๋ก ๊ฐ์ฒด ํƒ์ง€ ๋ชจ๋ธ์ด ๋งค์šฐ ์ž˜ ์˜ˆ์ธกํ•œ ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค.

 

IoU๊ฐ’์— ๋”ฐ๋ฅธ ์‹ค์ œ ๋ฐ•์Šค์™€ ์˜ˆ์ธก ๋ฐ•์Šค์˜ ๊ฒน์นจ ์‹œ๊ฐํ™”

5-2. NMS(Non-Max Suppression)

NMS๋Š” ํƒ์ง€ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ์ธก์ •ํ•˜๋Š” ๋ฉ”ํŠธ๋ฆญ์ด๋ผ๊ธฐ ๋ณด๋‹ค๋Š” ํƒ์ง€ ๋ชจ๋ธ์ด ์˜ค๋ธŒ์ ํŠธ๋ฅผ ์ •ํ™•ํ•˜๊ฒŒ ์˜ˆ์ธกํ•˜๋„๋ก ๋„์™€์ฃผ๋Š” ๊ธฐ์ˆ ์ด๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ์„ ๊ฒƒ ๊ฐ™๋‹ค.(ํ˜น์‹œ ๋ฉ”ํŠธ๋ฆญ์ด๋ผ๋Š” ์ด๊ฒฌ์ด ์žˆ์œผ์‹œ๋‹ค๋ฉด ์ ๊ทน ํ”ผ๋“œ๋ฐฑ ๋ถ€ํƒ๋“œ๋ฆฝ๋‹ˆ๋‹ค!)

 

NMS๋ž€, ์—ฌ๋Ÿฌ๊ฐœ์˜ ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค๋“ค ์ค‘ ๊ฐ์ฒด์˜ Confidence Score๊ฐ€ ๊ฐ€์žฅ ๋†’์€ ๋ฐ•์Šค๋ฅผ ์„ ์ •ํ•˜๊ณ  ์ด Score๋ณด๋‹ค ๋‚ฎ์€ ๋ฐ•์Šค๋“ค์€ ์‚ญ์ œํ•œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  Score๊ฐ€ ๊ฐ€์žฅ ๋†’์€ ๋ฐ•์Šค์™€ ๋‹ค๋ฅธ ๋ฐ•์Šค๋“ค ๊ฐ„์˜ IoU๋ฅผ ๊ณ„์‚ฐํ•˜๊ณ  ๋ฏธ๋ฆฌ ์ง€์ •ํ•œ IoU ์ž„๊ณ—๊ฐ’ ๋ณด๋‹ค ํฐ ๋‹ค๋ฅธ ๋ฐ•์Šค๋“ค์„ ๋ชจ๋‘ ์ œ๊ฑฐ(๊ตณ์ด ๋งํ•˜๋ฉด ์ œ๊ฑฐ๋ณด๋‹ค๋Š” Suppress, ์–ต๋ˆ„๋ฅด๊ฒŒ ๋œ๋‹ค)ํ•˜๊ฒŒ ๋œ๋‹ค. ์•„๋งˆ ํ…์ŠคํŠธ๋งŒ์œผ๋กœ๋Š” ๊ฐ์ด ์ž˜ ์•ˆ์˜ฌ ๊ฒƒ์ด๋‹ค. ๋‹ค์Œ ๊ทธ๋ฆผ์„ ์‚ดํŽด๋ณด์ž.

 

Non-Max-Suppression ์ˆ˜ํ–‰๊ณผ์ •

(# ์ฐธ๊ณ ๋กœ ๋ฐ•์Šค๋“ค ๊ฐ„ IoU๊ฐ’ ๊ณ„์‚ฐ์€ ์ž„์˜๋กœ ์ˆ˜ํ–‰ํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค!)

์œ„ ๊ทธ๋ฆผ๊ณผ ์„ค๋ช…์„ ์ฒœ์ฒœํžˆ ์ฝ์–ด๋ณด์ž. ๋จผ์ € Confidence Score๋ž€, ํŠน์ • ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค์•ˆ์— ์žˆ๋Š” ๊ฐ์ฒด๊ฐ€ ์–ด๋–ค ๋ฌผ์ฒด์˜ ํด๋ž˜์Šค์ผ ํ™•๋ฅ (4๋ฒˆ ๋ชฉ์ฐจ์—์„œ ์•„ํ‚คํ…์ฒ˜ ๊ทธ๋ฆผ์˜ Softmax ๋‹จ๊ณ„๋กœ ๋„์ถœ๋œ ํ™•๋ฅ ๊ฐ’)๊ณผ IoU๊ฐ’์„ ๊ณฑํ•œ ๊ฐ’์ธ๋ฐ, ์œ„ ๊ทธ๋ฆผ์˜ ์˜ˆ์‹œ๋กœ ๋“ค์ž๋ฉด ๊ฐ ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค์•ˆ์— ์ž๋™์ฐจ๊ฐ€ ์žˆ์„ ํ™•๋ฅ ์ด๋ผ๊ณ  ์ดํ•ดํ•˜๋ฉด ๋˜๊ฒ ๋‹ค.

 

NMS ๊ณผ์ •์„ ์ˆ˜ํ–‰ํ•˜๊ณ  ๋‚˜๋ฉด ํฌ๊ฒŒ 2๊ฐ€์ง€ ์ด์ ์ด ์žˆ๋‹ค. ์ด๋Š” ์‚ฌ์ „์— ๊ฒฐ์ •ํ•˜๋Š” Confidence Score Threshold์™€ IoU Threshold ๊ฐ’ 2๊ฐ€์ง€์™€ ์—ฐ๊ด€์ด ์žˆ๋‹ค.

 

  • Confidence Score Threshold๋กœ๋ถ€ํ„ฐ ์–ป๋Š” ์ด์ : ๊ทธ๋ฆผ์—์„œ ๋ณด๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๋นจ๊ฐ„์ƒ‰ ๋ฐ•์Šค์•ˆ์— ์žˆ๋Š” ์ž๋™์ฐจ ๊ฐ์ฒด๋ฅผ ํƒ์ง€ํ•˜๊ธฐ ์œ„ํ•ด 3๊ฐœ์˜ ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค๊ฐ€ ๋„์ถœ๋œ ๊ฒƒ์„ ๋ณผ ์ˆ˜ ์žˆ๋‹ค. ์ด ๋•Œ NMS๋ฅผ ์ˆ˜ํ–‰ํ•˜๊ฒŒ ๋˜๋ฉด ์ž๋™์ฐจ ๊ฐ์ฒด๋ฅผ ๊ฐ€์žฅ ์ž˜ ํƒ์ง€ํ•œ ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค๋ฅผ ์ œ์™ธํ•œ ๋‚˜๋จธ์ง€ ํŒŒ๋ž€์ƒ‰ ๋ฐ•์Šค๋“ค์„ ๋ชจ๋‘ ์‚ญ์ œํ•ด ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค๊ฐ€ ์—ฌ๋Ÿฌ๊ฐœ ๋‚˜์˜ค๋Š” ๊ฒƒ์„ ๋ง‰์„ ์ˆ˜ ์žˆ๋‹ค.
  • IoU Threshold๋กœ๋ถ€ํ„ฐ ์–ป๋Š” ์ด์ : ์ดˆ๋ก์ƒ‰ ๋„ค๋ชจ๋ฐ•์Šค๋ฅผ ์‚ญ์ œํ•˜์ง€ ์•Š๊ณ  ์œ ์ง€์‹œ์ผœ ๋‹ค๋ฅธ ๊ณณ์— ์žˆ๋Š” ๊ฐ์ฒด๋“ค์„ ํƒ์ง€ํ•˜๋„๋ก ํ•œ๋‹ค.(๋‹ค์ˆ˜์˜ ๊ฐ์ฒด๋ฅผ ํƒ์ง€ํ•˜๋„๋ก ๋„์™€์ค€๋‹ค๋Š” ์˜๋ฏธ)

5-3. mAP(mean-Average Precision)

์ด ๊ฐœ๋…์„ ์•Œ๊ธฐ ์ „์— Precision, Recall์— ๋Œ€ํ•œ ๊ฐœ๋…์„ ์•Œ๊ณ  ๊ฐ€์•ผ ํ•œ๋‹ค. ์ž˜ ๋ชจ๋ฅธ๋‹ค๋ฉด ์ด ํฌ์ŠคํŒ…์˜ '4.Model์˜ ํ‰๊ฐ€' ๋ชฉ์ฐจ๋ถ€๋ถ„์„ ์‚ดํŽด๋ณด์ž. ์ปดํ“จํ„ฐ ๋น„์ „์—์„œ Confusion Matrix์˜ TP(True Positive), FN(False Negative), FP(False, Positive)๊ฐ€ ์˜๋ฏธํ•˜๋Š” ๋ฐ”๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

 

์ปดํ“จํ„ฐ ๋น„์ „์—์„œ์˜ TP, FP, FN์˜ ์˜๋ฏธ

 

๊ทธ๋Ÿฐ๋ฐ Precision, Recall์€ Trade-off ๊ด€๊ณ„๊ฐ€ ์กด์žฌํ•œ๋‹ค. ์ฆ‰, ๋‘ ๊ฐœ์˜ ๊ฐ’์„ ๋ชจ๋‘ ์ตœ์ƒ์œ„ ๊ฐ’์œผ๋กœ ๋Œ์–ด์˜ฌ๋ฆด ์ˆ˜ ์—†๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ๊ทธ๋ž˜์„œ ๋‘˜ ์ค‘ ํ•˜๋‚˜์˜ ๊ฐ’์„ ๋Œ์–ด์˜ฌ๋ฆฌ๊ธฐ์—๋งŒ ๋ชฐ๋‘ํ•˜๋‹ค ๋ณด๋ฉด ์ˆ˜์น˜์ ์ธ ๊ฐ’์œผ๋กœ๋Š” ๋ฉ€์ฉกํ•ด ๋ณด์ด์ง€๋งŒ ์•Œ๊ณ ๋ณด๋ฉด ์‹ฌ๊ฐํ•œ ์˜ค๋ฅ˜๋ฅผ ๋ฐœ๊ฒฌํ•  ์ˆ˜ ์žˆ๋‹ค.

 

  • Precision์„ 100%๋กœ ์˜ฌ๋ฆฌ๋ ค ํ•œ๋‹ค๋ฉด ์ •๋ง ๋†’์€ ํ™•๋ฅ ๋กœ ์˜ˆ์ธก๋œ ๊ฒƒ๋งŒ ๋ชจ๋ธ์ด Positive๋ผ๊ณ  ์˜ˆ์ธก(๋ชจ๋ธ์ด ๋ณด๊ธฐ์— ํ™•์‹คํ•œ ๊ฒƒ๋งŒ ์˜ˆ์ธก)ํ•˜๊ณ  ๋‚˜๋จธ์ง€๋Š” ๋ชจ๋‘ Negative๋ผ๊ณ  ์˜ˆ์ธกํ•˜๋ฉด ๋œ๋‹ค. ์ด๋Ÿฌ๋ฉด FP(False Positive, ๋ชจ๋ธ์ด Positive๋ผ๊ณ  ์˜ˆ์ธกํ–ˆ์„ ๋•Œ, ์‹ค์ œ Negative์ธ ๊ฒฝ์šฐ)๊ฐ’์ด 0์ด ๋œ๋‹ค.
  • Recall์„ 100%๋กœ ์˜ฌ๋ฆฌ๋ ค ํ•œ๋‹ค๋ฉด ๋ชจ๋“  ๊ฒฝ์šฐ๋ฅผ ๋ชจ๋ธ์ด Positive๋ผ๊ณ  ์˜ˆ์ธกํ•˜๋ฉด ๋œ๋‹ค. ์ด๋Ÿฌ๋ฉด FN(False Negative, ๋ชจ๋ธ์ด Negative๋ผ๊ณ  ์˜ˆ์ธกํ–ˆ์„ ๋•Œ, ์‹ค์ œ Positive์ธ ๊ฒฝ์šฐ)๊ฐ’์ด 0์ด ๋œ๋‹ค.

์ด๋ ‡๊ฒŒ Precision, Recall ์ˆ˜์น˜๋ฅผ ์ž˜๋ชป ์‚ฌ์šฉํ•˜๊ฒŒ ๋˜๋ฉด ์˜ค๋ฅ˜๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— Confidence Score ์ž„๊ณ—๊ฐ’์„ ์กฐ์ ˆํ•˜๋ฉด์„œ ์–ป์€ Precision-Recall Curve ๊ทธ๋ž˜ํ”„๋ฅผ ๊ทธ๋ ค ๊ทธ๋ž˜ํ”„ ์•„๋ž˜ ๋ฉด์ ์„ ๋‚˜ํƒ€๋‚ด๋Š” AP(Average Precision)๊ฐ’์„ ์ด์šฉํ•˜๋Š” ๊ฒƒ์ด ์ข‹๋‹ค. 

 

์ถœ์ฒ˜ : ๋‹คํฌํ”„๋กœ๊ทธ๋ž˜๋จธ๋‹˜ ๋ธ”๋กœ๊ทธ

 

AP๋Š” Confidence Score ๊ฐ’์— ๋”ฐ๋ผ ์–ป์€ ๊ทธ๋ž˜ํ”„์ด๊ธฐ ๋•Œ๋ฌธ์— Confidence Score๋ฅผ ๋†’๊ฒŒ ์„ค์ •ํ•œ๋‹ค๋ฉด ๊ฐ์ฒด ํƒ์ง€ ๋ชจ๋ธ์ด ์ •๋ง ํ™•์‹ ํ•˜๋Š” ์ผ€์ด์Šค๋งŒ Positive๋ผ๊ณ  ์˜ˆ์ธกํ•˜๊ธฐ ๋•Œ๋ฌธ์— Precision์€ ๋งค์šฐ ๋†’์•„์ง€๋Š” ๋ฐ˜๋ฉด Recall ์ˆ˜์น˜๋Š” ๋‚ฎ์•„์ง€๊ฒŒ ๋œ๋‹ค.

 

๋ฐ˜๋Œ€๋กœ Confidence Score๋ฅผ ๋‚ฎ๊ฒŒ ์„ค์ •ํ•œ๋‹ค๋ฉด ๊ฐ์ฒด ํƒ์ง€ ๋ชจ๋ธ์ด ๋ชจ๋“  ์ผ€์ด์Šค์— ๋Œ€ํ•ด Positive๋ผ๊ณ  ์˜ˆ์ธก ๋‚œ์‚ฌ(?)๋ฅผ ํ•ด๋ฒ„๋ฆฌ๊ธฐ ๋•Œ๋ฌธ์— Recall ์ˆ˜์น˜๋Š” ๋งค์šฐ ๋†’์•„์ง€์ง€๋งŒ Precision ์ˆ˜์น˜๋Š” ๋‚ฎ์•„์ง€๊ฒŒ ๋œ๋‹ค.

 

์–ด์จŒ๊ฑฐ๋‚˜ ์œ„์™€ ๊ฐ™์ด Precision-Recall Curve ๊ทธ๋ž˜ํ”„์˜ ์•„๋ž˜ ๋ฉด์  ๋„“์ด๋ฅผ ๊ตฌํ•ด AP๊ฐ’์„ ๊ตฌํ•˜๊ฒŒ ๋œ๋‹ค. ์ด๋ ‡๊ฒŒ ๊ตฌํ•œ ํ•˜๋‚˜์˜ AP๊ฐ’์€ ํ•˜๋‚˜์˜ ๊ฐ์ฒด(Object)์— ๋Œ€ํ•œ ํƒ์ง€ ์„ฑ๋Šฅ์ด๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด AP์— ํ‰๊ท ๊ฐ’์„ ์ทจํ•œ mAP๋Š” ๋ฌด์—‡์„ ์˜๋ฏธํ•˜๋Š” ๊ฑธ๊นŒ?

 

์„ธ์ƒ์—๋Š” ํ•˜๋‚˜์˜ ๊ฐ์ฒด๋งŒ ๋‹ด๊ธด ์ด๋ฏธ์ง€๊ฐ€ ์žˆ์„ ์ˆ˜ ์žˆ์ง€๋งŒ ์—ฌ๋Ÿฌ๊ฐœ์˜ ๊ฐ์ฒด๋“ค์ด ๋‹ด๊ธด ์ด๋ฏธ์ง€๋„ ์žˆ๋‹ค. mAP๋Š” ํ›„์ž์˜ ๊ฒฝ์šฐ์— ์‚ฌ์šฉํ•˜๋Š” ๊ฐœ๋…์ด๋‹ค. ์ฆ‰, mAP๋Š” ์—ฌ๋Ÿฌ๊ฐœ์˜ ๊ฐ์ฒด๋“ค์ด ๋‹ด๊ธด ์ด๋ฏธ์ง€๋ฅผ ๊ฐ์ฒด ํƒ์ง€ํ–ˆ์„ ๋•Œ ํ•˜๋‚˜์˜ ๊ฐ์ฒด์— ๋Œ€ํ•œ AP๊ฐ’์„ ๊ตฌํ•˜๊ณ  ์ด๋ฏธ์ง€์— ์กด์žฌํ•˜๋Š” ๊ฐ์ฒด๋“ค์˜ ๊ฐœ์ˆ˜๋งŒํผ ํ‰๊ท ๊ฐ’์„ ์ทจํ•ด์ฃผ๋Š” ๊ฒƒ์ด๋‹ค.

 


์ด๋ ‡๊ฒŒ ๊ฐ์ฒด ํƒ์ง€์— ๋Œ€ํ•œ ์—ฌ๋Ÿฌ๊ฐ€์ง€ ๊ฐœ๋…๊ณผ ๋ฉ”ํŠธ๋ฆญ ๋ช‡ ๊ฐ€์ง€์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์•˜๋‹ค. ๋‹ค์Œ ํฌ์ŠคํŒ…๋ถ€ํ„ด ์ด ๊ฐœ๋…๋“ค์„ ๊ธฐ์ดˆ๋กœ ํ•˜์—ฌ RCNN, Faster RCNN, YOLO ๋“ฑ๊ณผ ๊ฐ™์€ Object Detection Network์— ๋Œ€ํ•ด ์ฐจ๊ทผ์ฐจ๊ทผ ๋ฐฐ์šฐ๊ณ  ์†Œ๊ฐœํ•ด๋ณด๋ ค ํ•œ๋‹ค. 

 

 

๋ฐ˜์‘ํ˜•