๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

Data Science/Computer Vision

[ML] SPP(Spatial Pyramid Pooling) Object Detection ๋ชจ๋ธ

๋ฐ˜์‘ํ˜•

๐Ÿ”Š ํ•ด๋‹น ํฌ์ŠคํŒ…์—์„œ ์‚ฌ์šฉ๋œ ์ปจํ…์ธ ๋Š” ์ธํ”„๋Ÿฐ์˜ ๋”ฅ๋Ÿฌ๋‹ ์ปดํ“จํ„ฐ ๋น„์ „ ์™„๋ฒฝ ๊ฐ€์ด๋“œ ๊ฐ•์˜ ๋‚ด์šฉ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ–ˆ์Œ์„ ์•Œ๋ฆฝ๋‹ˆ๋‹ค. ์„ค๋ช…์—์„œ ์‚ฌ์šฉ๋œ ์ž๋ฃŒ๋Š” ์ตœ๋Œ€ํ•œ ์ œ๊ฐ€ ์ง์ ‘ ์žฌ๊ตฌ์„ฑํ•œ ์ž๋ฃŒ์ž„์„ ์•Œ๋ฆฝ๋‹ˆ๋‹ค.

 

์ด๋ฒˆ ํฌ์ŠคํŒ…์—์„œ๋Š” ์ด์ „ ํฌ์ŠคํŒ…์—์„œ ์†Œ๊ฐœํ–ˆ๋˜ RCNN ๋ชจ๋ธ์˜ ๋‹จ์ ์„ ๊ทน๋ณตํ•˜๋Š” SPP(Spatial Pyramid Pooling) ๋ชจ๋ธ์— ๋Œ€ํ•ด ์•Œ์•„๋ณด๋ ค๊ณ  ํ•œ๋‹ค. ํ•ด๋‹น ๋ชจ๋ธ์„ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•ด์„œ RCNN ๊ด€๋ จ ํฌ์ŠคํŒ…์„ ์ฝ๊ณ  ์˜ค๋Š” ๊ฒƒ์„ ๊ถŒ์žฅํ•œ๋‹ค.

 

SPP์˜ Pyramid Pooling์€ ๋ฌด์—‡์„ ์˜๋ฏธํ•˜๋Š” ๊ฑธ๊นŒ?


1. SPP Net ๊ณผ RCNN์˜ ๊ด€๊ณ„

๋จผ์ € SPP Net์— ๋Œ€ํ•ด ์•Œ์•„๋ณด๊ธฐ ์ „์— SPP Net์€ RCNN์˜ ํ•œ๊ณ„์ ์„ ๊ทน๋ณตํ•˜๊ณ ์ž ๋‚˜์˜จ ๋ชจ๋ธ์ด๋‹ค. ๊ทธ๋ ‡๊ธฐ ๋•Œ๋ฌธ์— RCNN์˜ ํ•œ๊ณ„์ ์„ ๊ฐ„๋‹จํ•˜๊ฒŒ ๋‹ค์‹œ ๋ณต์Šตํ•ด๋ณด๊ณ  ์ด 2๊ฐ€์ง€์— ์ค‘์ ์„ ๋‘๊ณ  SPP ๋ชจ๋ธ์„ ์ดํ•ดํ•ด๋ณด์ž.

 

  • ๊ฐ Region Proposal ๋งˆ๋‹ค Object Detection์„ ๋ณ„๊ฐœ๋กœ ์ˆ˜ํ–‰ํ•ด์ฃผ์–ด์•ผ ํ•ด์„œ ๋งค์šฐ ์˜ค๋žœ ํ•™์Šต์‹œ๊ฐ„์ด ์†Œ์š”๋œ๋‹ค.
  • ์—ฌ๋Ÿฌ๊ฐœ์˜ Region Proposal๋“ค์„ Pretrained๋œ Feature Extractor๊ฐ€ ์š”๊ตฌํ•˜๋Š” ๊ณ ์ •๋œ ์‚ฌ์ด์ฆˆ๋กœ ํ†ต์ผ์‹œ์ผœ์ฃผ์–ด์•ผ ํ•ด์„œ Region Proposal์„ ์ž๋ฅด๊ฑฐ๋‚˜ ์ฐŒ๊ทธ๋Ÿฌ๋œจ๋ ค ์ด๋ฏธ์ง€๋ฅผ ์†์ƒ(?)์‹œํ‚ค๊ฒŒ ๋œ๋‹ค.

SPP ๋ชจ๋ธ์€ ์œ„์™€ ๊ฐ™์€ 2๊ฐ€์ง€ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•œ๋‹ค. ๊ทธ ์ค‘์—์„œ 2๋ฒˆ์งธ์˜ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐ ์ง‘์ค‘๋˜์–ด ์žˆ๋‹ค. ๋จผ์ € SPP ๋ชจ๋ธ์˜ ํฐ ์•„ํ‚คํ…์ฒ˜๋ฅผ ์‚ดํŽด๋ณด์ž.

 

SPP Net์˜ ์ „๋ฐ˜์ ์ธ ์•„ํ‚คํ…์ฒ˜

 

์œ„ ๊ทธ๋ฆผ์—์„œ $\cdots$ ๋ถ€๋ถ„์€ ๊ธฐ๋ณธ์ ์ธ Object Detection Network๋“ค์˜ ๊ฐ์ฒด ํด๋ž˜์Šค ๋ถ„๋ฅ˜๋ฅผ ์œ„ํ•œ Softmax Layer์™€ SVM Classifier, ๊ทธ๋ฆฌ๊ณ  ๋ถ„๋ฅ˜ํ•œ ๊ฐ์ฒด๋ฅผ ํ‘œ์‹œํ•˜๋Š” Bounding Box์˜ ์ขŒํ‘œ๋ฅผ ํšŒ๊ท€ํ•˜๋Š” ๊ตฌ์กฐ๋กœ RCNN ๋ชจ๋ธ๊ณผ ๋™์ผํ•˜๋‹ค.

 

๋จผ์ € ์ธํ’‹ ์ด๋ฏธ์ง€๋Š” ํ•œ ๋ฒˆ์€ Selective Search๋ฅผ ์ˆ˜ํ–‰ํ•ด์„œ Region Proposal์„ ์ˆ˜ํ–‰ํ•ด์ฃผ๊ณ , ํ•œ ๋ฒˆ์€ Feature Extractor๋กœ ๋“ค์–ด๊ฐ€ ์ธํ’‹ ์ด๋ฏธ์ง€์˜ Feature Map์„ ์ถ”์ถœํ•œ๋‹ค. ์ด ๋•Œ ์ฃผ๋ชฉํ•  ์ ์€ Selective Search๋ฅผ ํ†ตํ•ด ๋‚˜์˜จ Region Proposal๋“ค ์ค‘ ์ด๋ฏธ์ง€์˜ Feature Map๊ณผ ๋น„์Šทํ•œ Region ๋ผ๋ฆฌ ๋งคํ•‘์„ ์‹œ์ผœ์ค€๋‹ค.(์ด๋ฅผ ROI=Regions Of Interest ๋ผ๊ณ ๋„ ํ•œ๋‹ค.) ์ด๋Ÿฌํ•œ ๋ฐฉ๋ฒ•์€ ์ด์ „์˜ RCNN์—์„œ ํ•˜๋‚˜์˜ Region Proposal ๋งˆ๋‹ค Feature Extractor์— ๊ฐ๊ฐ ๋“ค์–ด๊ฐ€๋ฉด์„œ ์ƒ๊ธฐ๋Š” '์˜ค๋žœ ํ•™์Šต ์‹œ๊ฐ„'์ด๋ผ๋Š” ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•ด์ค€๋‹ค.

 

๋งคํ•‘ํ•˜๋Š” ๊ณผ์ •์„ ๋๋‚ด๋ฉด ๋งคํ•‘๋œ [ํ•˜๋‚˜์˜ Region Proposal - ํ•˜๋‚˜์˜ Feature Map] ๋“ค์ด ๋ชจ์—ฌ ์—ฌ๋Ÿฌ๊ฐœ์˜ [ํ•˜๋‚˜์˜ Region Proposal - ํ•˜๋‚˜์˜ Feature Map] ๋งคํ•‘๋œ ๊ฐ’๋“ค์ด ์žˆ์„ ๊ฒƒ์ด๋‹ค. ๊ทธ๋Ÿฐ๋ฐ ์•ž์„œ ๋งํ–ˆ๋˜ ๊ฒƒ์ฒ˜๋Ÿผ Region Proposal์€ ๊ฐ๊ธฐ ์„œ๋กœ ํฌ๊ธฐ๊ฐ€ ๋‹ค๋ฅด๊ธฐ ๋•Œ๋ฌธ์— Flatten Layer๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๋ฐ ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•œ๋‹ค. ๋”ฐ๋ผ์„œ ์šฐ๋ฆฌ๋Š” ์ด์ œ SPP ๊ณผ์ •์„ ํ†ตํ•ด ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์ž.

2. SPP Net์ด๋ž€?

์ •ํ™•ํ•˜๊ฒŒ ๋งํ•˜๋ฉด SPP Net์€ SPP๋ผ๋Š” Pooling Layer๊ฐ€ ์—ฌ๋Ÿฌ๊ฐœ ๊ฒน์ณ์žˆ๋Š” ๋„คํŠธ์›Œํฌ๋ฅผ ์˜๋ฏธํ•œ๋‹ค. ๊ทธ๋ž˜์„œ ์šฐ๋ฆฌ๋Š” SPP๋ผ๋Š” Pooling ๊ณผ์ •์ด ๋ฌด์—‡์ธ์ง€ ์ดํ•ดํ•˜๋Š” ๊ฒƒ์ด ์šฐ์„ ์ด๋‹ค. ํ…์ŠคํŠธ๋กœ SPP๋ฅผ ์ •์˜ํ•˜์ž๋ฉด, SPP๋Š” ํŠน์ • Pooling ๊ณผ์ •์„ ํ†ต๊ณผํ•˜๋ฉด ์‚ฌ์ด์ฆˆ๊ฐ€ ๋‹ค๋ฅธ Region Proposal๋“ค์„ ๊ณ ์ •๋œ ์‚ฌ์ด์ฆˆ์˜ ๋ฒกํ„ฐ๋“ค๋กœ ๋ณ€ํ™˜์‹œํ‚ค๋Š” ๊ณผ์ •์ด๋‹ค.

 

SPP๋Š” ์›๋ž˜ ๋‹จ์ผ CNN ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๋Š” ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ๋ฌธ์ œ์—์„œ ์„œ๋กœ ๋‹ค๋ฅธ ์ด๋ฏธ์ง€์˜ ํฌ๊ธฐ๋ฅผ ๊ณ ์ •๋œ ํฌ๊ธฐ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ธฐ๋ฒ•์œผ๋กœ ์ž์ฃผ ์‚ฌ์šฉ๋˜์—ˆ๋‹ค๊ณ  ํ•œ๋‹ค. ๊ฒฐ๊ตญ ํฌ๊ธฐ๊ฐ€ ๋‹ค๋ฅธ ์ด๋ฏธ์ง€๋“ค์€ ์ž๋ฅด๊ฑฐ๋‚˜ ๋ณ€ํ˜•ํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹Œ SPP๋ผ๋Š” ๊ณผ์ •์„ ํ†ตํ•ด ์ง€์ •๋œ ์‚ฌ์ด์ฆˆ๋กœ ํ†ต์ผ์‹œ์ผœ์ค€๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ๊ทธ๋ž˜์„œ SPP๋ฅผ ์‚ฌ์šฉํ•˜๊ฒŒ ๋˜๋ฉด ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ์‹œ CNN ๋ชจ๋ธ ๊ณผ์ •์ด ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ฐจ์ด์ ์ด ์ƒ๊ธด๋‹ค.

 

์ผ๋ฐ˜์ ์ธ CNN, SPP ์ ์šฉ CNN ๋ชจ๋ธ ๊ตฌ์กฐ ์ฐจ์ด

 

๊ทธ๋ฆผ์—์„œ ๋ณด๋‹ค์‹œํ”ผ SPP๋ฅผ ์ ์šฉํ•˜๊ฒŒ ๋˜๋ฉด ์ด๋ฏธ์ง€๋ฅผ ๋ณ€ํ˜•ํ•  ํ•„์š”๊ฐ€ ์—†๋‹ค. ๋‹จ, SPP๋Š” Convolution์ด ์ ์šฉ๋˜๋Š” CNN Model์„ ๊ฑฐ์น˜๊ณ  ๋‚œ ํ›„ ์ ์šฉ๋œ๋‹ค. ์™œ๋ƒํ•˜๋ฉด SPP๋ฅผ ์ด์šฉํ•ด์„œ ๋™์ผํ•œ ํฌ๊ธฐ ์‚ฌ์ด์ฆˆ์˜ ๋ฒกํ„ฐ๋กœ ๊ฒฐํ•ฉ์„ ํ•˜๊ณ  Flatten ์‹œ์ผœ FC Layer๋ฅผ ๋งŒ๋“ค์–ด์•ผ ํ•˜๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.

3. SPP์˜ ์กฐ์ƒ์€ SPM์ด๋‹ค!

SPP๋Š” ์›๋ž˜ SPM(Spatial Pyramid Matching)์— ๊ธฐ๋ฐ˜์„ ๋‘” ๋ฐฉ๋ฒ•์ด๋‹ค. ๋”ฐ๋ผ์„œ SPP๋ฅผ ์ดํ•ดํ•˜๊ธฐ ์ „์— SPM์„ ๋จผ์ € ์ดํ•ดํ•ด์•ผ ํ•œ๋‹ค. SPM์€ ๋งˆ์น˜ NLP(์ž์—ฐ์–ด ์ฒ˜๋ฆฌ) ๋ถ„์•ผ์—์„œ Bag of Words์™€ ๋น„์Šทํ•˜๋‹ค. Bag of Words๋ž€, ํŠน์ • ๋ฌธ์„œ์—์„œ ๋‹จ์–ด์˜ ๋นˆ๋„์ˆ˜์— ๊ธฐ๋ฐ˜ํ•ด ๋งŒ๋“  ๋ฒกํ„ฐ๋ฅผ ์˜๋ฏธํ•œ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, "๊ฐ•์•„์ง€๋Š” ๋™๋ฌผ์ด๋‹ค. ๊ฐ•์•„์ง€๋Š” ์‚ฌ๋žŒ์„ ์ž˜ ๋”ฐ๋ฅด๊ณ  ๊ฐ€๋”์€ ์ธ๊ฐ„๋ณด๋‹ค ๋˜‘๋˜‘ํ•œ ๊ฒƒ ๊ฐ™๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๊ฐ•์•„์ง€์˜ ์‹ค์ œ IQ ์ง€์ˆ˜๋Š” ๊ทธ๋ ‡์ง€ ์•Š๋‹ค." ๋ผ๋Š” ๋ฌธ์žฅ์ด ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜์ž. ์ด ๋ฌธ์žฅ์—์„œ ๊ฐ ๋‹จ์–ด์˜ ๋นˆ๋„์ˆ˜๋ฅผ count ํ•ด๋ณด๋ฉด '๊ฐ•์•„์ง€' ๋ผ๋Š” ๋‹จ์–ด๊ฐ€ ๊ฐ€์žฅ ๋งŽ์„ ๊ฒƒ์ด๋‹ค. ๋”ฐ๋ผ์„œ ํ•ด๋‹น ๋ฌธ์žฅ์€ '๊ฐ•์•„์ง€' ๋ผ๋Š” ์ฃผ์ œ์— ๊ด€ํ•œ ๋ฌธ์žฅ์ž„์„ ์ถ”์ธกํ•  ์ˆ˜ ์žˆ๋‹ค.(๊ทธ๋ž˜๋„ Bag of Words์— ๋Œ€ํ•œ ๊ฐœ๋…์ด ์™€๋‹ฟ์ง€ ์•Š๋Š”๋‹ค๋ฉด ์—ฌ๊ธฐ๋ฅผ ์ฐธ๊ณ ํ•ด ๋ณด์„ธ์š”!)

 

์ด๋Ÿฌํ•œ Bag of Words์— ๋Œ€ํ•œ ์›๋ฆฌ๋ฅผ ์ด๋ฏธ์ง€ ๋ถ„์•ผ์— ์ ์šฉํ•œ ๊ฒƒ์ด Bag of Visual Words๋ผ๊ณ  ํ•œ๋‹ค. ๋‹ค์Œ ๊ทธ๋ฆผ์„ ๋ณด์ž.

 

Bag of Visual Words

 

์œ„ ๊ทธ๋ฆผ์ฒ˜๋Ÿผ 3๊ฐœ์˜ ์›๋ณธ ์ด๋ฏธ์ง€๊ฐ€ ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ–ˆ์„ ๋•Œ, ์ด๋ฏธ์ง€์˜ Region ๋ณ„๋กœ ์—ฌ๋Ÿฌ๊ฐœ์˜ Feature๋“ค์„ ์ถ”์ถœํ•œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ๊ฐ Feature ๋ณ„๋กœ ์ด๋ฏธ์ง€์—์„œ ๋‚˜ํƒ€๋‚˜๋Š” ๋นˆ๋„์ˆ˜๋ฅผ countํ•˜๊ณ  ํžˆ์Šคํ† ๊ทธ๋žจ์œผ๋กœ ํ‘œ์‹œํ•œ๋‹ค. ๊ทธ๋ž˜์„œ "์–ด๋–ค Feature๋“ค์ด ๋งŽ์ด ๋‚˜ํƒ€๋‚˜๋ฉด ์–ด๋–ค ์ด๋ฏธ์ง€์ผ ๊ฒƒ์ด๋‹ค!" ๋ผ๋Š” ์ถ”๋ก ์ด ๊ฐ€๋Šฅํ•˜๋‹ค.

 

ํ•˜์ง€๋งŒ ์ด๋ ‡๊ฒŒ Bag of Visual Words๋งŒ ์‚ฌ์šฉํ•ด์„œ๋Š” ์น˜๋ช…์ ์ธ ๋‹จ์ ์ด ์žˆ๋‹ค. ๋ฐ”๋กœ ์ด๋ฏธ์ง€์˜ ์œ„์น˜์ ์ธ ํŠน์„ฑ์„ ๊ณ ๋ คํ•˜์ง€ ๋ชปํ•œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ์ด๋ฏธ์ง€์˜ ์œ„์น˜์ ์ธ ํŠน์„ฑ์ด๋ž€ ์˜ˆ๋ฅผ ๋“ค๋ฉด, ๋‚˜๋ฌด(tree)๋ฅผ ์ƒ์ง•ํ•˜๋Š” Feature๋“ค์ด ๊ฐ€์žฅ ๋งŽ์ด ๋‚˜์™€์„œ "์ด๊ฑฐ๋Š” '์ˆฒ' ์ด๋ฏธ์ง€์ผ๊ฑฐ์•ผ!" ๋ผ๊ณ  ์ถ”๋ก ํ–ˆ์ง€๋งŒ, ์›๋ณธ ์ด๋ฏธ์ง€๋ฅผ ์‚ดํŽด๋ณด๋‹ˆ ์ด๋ฏธ์ง€๊ฐ€ ๋‹ด๊ณ  ์žˆ๋Š” ์ค‘์‹ฌ ๋‚ด์šฉ์€ ์ˆฒ์ด ์•„๋‹ˆ๋ผ ์‚ฌ๋žŒ๋“ค์ด์—ˆ๋‹ค. ๋ฐ”๋กœ ์•„๋ž˜์˜ ์‚ฌ์ง„๊ณผ ๊ฐ™์ด ๋ง์ด๋‹ค.

 

Feature์˜ ์œ„์น˜์  ํŠน์„ฑ์„ ๊ณ ๋ คํ•˜์ง€ ๋ชปํ•˜๋ฉด ์ด ์‚ฌ์ง„์„ '์ˆฒ' ์ด๋ฏธ์ง€๋กœ ํŒ๋‹จํ•  ์ˆ˜๋„ ์žˆ์„ ๊ฒƒ์ด๋‹ค.

 

๊ทธ๋ž˜์„œ ์ด๋Ÿฌํ•œ ๋ฌธ์ œ์ ์„ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด์„œ ์ด๋ฏธ์ง€๋ฅผ ๋ถ„ํ• ํ•ด ๋ถ„๋ฉด์„ ๋‚˜๋ˆ„๋Š” ํ•ด๊ฒฐ์ฑ…์ด ์ œ์‹œ๋œ๋‹ค. ์ฆ‰, ์ด๋ฏธ์ง€๋ฅผ ์—ฌ๋Ÿฌ๊ฐœ์˜ ๋ฉด์œผ๋กœ ๋ถ„ํ• ํ•ด์„œ ๊ฐ ๋ถ„๋ฉด๋งˆ๋‹ค Bag of Visual Words๋ฅผ ์ ์šฉํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์ด ๋ถ„ํ• ํ•˜๋Š” ๋ถ„๋ฉด์„ ์—ฌ๋Ÿฌ๋ฒˆ ์ง„ํ–‰ํ•œ๋‹ค. ์ดํ•ด๋ฅผ ์œ„ํ•ด ๋‹ค์Œ ๊ทธ๋ฆผ์„ ๋ณด์ž.

 

๋ถ„ํ• ์„ ํ™œ์šฉํ•œ SPM ๊ณผ์ •

 

ํ•ด๋‹น ๊ทธ๋ฆผ์€ ํ•„์ž๊ฐ€ ๋ฐฐ์šด ๋‚ด์šฉ์„ ํ† ๋Œ€๋กœ ์ง์ ‘ ๋งŒ๋“ค์–ด๋ณธ ์ž๋ฃŒ๋‹ค. ์œ„์™€ ๊ฐ™์ด ๋ถ„๋ฉด์„ ์•„์˜ˆ ํ•˜์ง€ ์•Š์•˜์„ ๋•Œ, 4๋ถ„๋ฉด์œผ๋กœ ๋‚˜๋ˆ„์—ˆ์„ ๋•Œ 2๋ฒˆ์„ ์ˆ˜ํ–‰ํ•˜์—ฌ SPM์„ ์ง„ํ–‰ํ•˜๊ณ  ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ Countํ•œ ๋ฒกํ„ฐ๋“ค์„ ํ•˜๋‚˜๋กœ ๊ฒฐํ•ฉํ•œ๋‹ค. ํ•ด๋‹น ์˜ˆ์‹œ์—์„œ๋Š” 2๋ฒˆ๋งŒ ๋ถ„ํ• ์„ ์ˆ˜ํ–‰ํ–ˆ์ง€๋งŒ ๊ฒฝ์šฐ์— ๋”ฐ๋ผ 8๋ถ„๋ฉด, 16๋ถ„๋ฉด ๋“ฑ ์—ฌ๋Ÿฌ ๋ฒˆ ๋ถ„๋ฉด์„ ์ˆ˜ํ–‰ํ•ด์„œ ๊ณ ์ •๋œ ์‚ฌ์ด์ฆˆ๋กœ ๋ฒกํ„ฐ๋ฅผ ๊ฒฐํ•ฉํ•  ์ˆ˜ ์žˆ๋‹ค.

 

์œ„์™€ ๊ฐ™์€ ๋ถ„๋ฉด์„ ์‚ฌ์šฉํ•œ SPM์„ ์‚ฌ์šฉํ•˜๊ฒŒ ๋˜๋ฉด Feature Map ๋˜๋Š” Region Proposal ์‚ฌ์ด์ฆˆ๊ฐ€ ์„œ๋กœ ๋‹ฌ๋ผ๋„ ๋ถ„๋ฉด ๋‚˜๋ˆ„๋Š” ๊ฐœ์ˆ˜, ํšŸ์ˆ˜๋ฅผ ๋™์ผํ•˜๊ฒŒ ์„ค์ •๋งŒ ํ•œ๋‹ค๋ฉด ๊ฒฐํ•ฉํ•œ ๋ฒกํ„ฐ๋“ค์˜ ์‚ฌ์ด์ฆˆ๋Š” ๋™์ผํ•˜๊ฒŒ ๋œ๋‹ค. 

 

๊ทธ๋ ‡๋‹ค๋ฉด SPP๋Š” ๋ฌด์—‡์ผ๊นŒ? ๋ฐ”๋กœ ์œ„ ๊ทธ๋ฆผ์—์„œ Count ๋ฒกํ„ฐ๋ฅผ ์ถ”์ถœํ•  ๋•Œ Max๊ฐ’๋งŒ Pooling ํ•ด์„œ ๋ฒกํ„ฐ๋ฅผ ๊ฒฐํ•ฉํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ๋ฐ”๋กœ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๋ง์ด๋‹ค.

 

SPP๋Š” SPM์—์„œ Max Pooling์„ ์ ์šฉํ•œ ๊ฒƒ์ด๋‹ค!

 

์ตœ์ข…์ ์œผ๋กœ ์œ„์™€ ๊ฐ™์ด SPP ๊ณผ์ •์„ ํ†ตํ•ด์„œ ๋ฒกํ„ฐ๋ฅผ ๋™์ผํ•œ ์‚ฌ์ด์ฆˆ๋กœ ๋งŒ๋“ค๊ณ  ์ด์ œ Dense Layer๋กœ ๋„˜๊ฒจ์ฃผ๋ฉด์„œ ์ตœ์ข… ํด๋ž˜์Šค๋ฅผ ๋ถ„๋ฅ˜ํ•˜๊ณ  ๋™์‹œ์— Bounding Box ํšŒ๊ท€๋ฅผ ์ˆ˜ํ–‰ํ•œ๋‹ค. ๋์œผ๋กœ SPP Net์— ๋Œ€ํ•œ ํฐ ์•„ํ‚คํ…์ฒ˜์˜ ์‚ฌ์ง„ ์ž๋ฃŒ๋ฅผ ๋ณด๊ณ  ๋งˆ๋ฌด๋ฆฌํ•˜์ž.

 

SPP Net์˜ ์•„ํ‚คํ…์ฒ˜


 

์ง€๊ธˆ๊นŒ์ง€ RCNN์˜ ๋ฌธ์ œ์ ์„ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋Š” SPP Net์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์•˜๋‹ค. ์ด๋Ÿฌํ•œ SPP Net์„ ์•ฝ๊ฐ„ ๋ณ€ํ˜•์‹œํ‚จ ๋ฒ„์ „์ด ๋ฐ”๋กœ Fast RCNN ๋ชจ๋ธ์ด๋‹ค. ๋‹ค์Œ ํฌ์ŠคํŒ…์—์„œ๋Š” Fast RCNN์— ๋Œ€ํ•ด ์•Œ์•„๋ณด๊ณ  SPP Net๊ณผ ์–ด๋–ค ์ฐจ์ด์ ์ด ์žˆ๋Š”์ง€์— ๋Œ€ํ•ด์„œ ์•Œ์•„๋ณด๋„๋ก ํ•˜์ž.

๋ฐ˜์‘ํ˜•