๐ ํด๋น ํฌ์คํ ์์ ์ฌ์ฉ๋ ์ปจํ ์ธ ๋ ์ธํ๋ฐ์ ๋ฅ๋ฌ๋ ์ปดํจํฐ ๋น์ ์๋ฒฝ ๊ฐ์ด๋ ๊ฐ์ ๋ด์ฉ์ ๊ธฐ๋ฐ์ผ๋ก ํ์์ ์๋ฆฝ๋๋ค. ์ค๋ช ์์ ์ฌ์ฉ๋ ์๋ฃ๋ ์ต๋ํ ์ ๊ฐ ์ง์ ์ฌ๊ตฌ์ฑํ ์๋ฃ์์ ์๋ฆฝ๋๋ค.
์ด๋ฒ ํฌ์คํ ์์๋ One-Stage Object Detection ๋ชจ๋ธ๋ก์ YOLO ๋ชจ๋ธ์ ๋ํด ์์๋ณด๋ ค๊ณ ํ๋ค. ์๋ YOLO๊ฐ ์ต์ด๋ก ์ถ์๋ ๋ฒ์ 1 ๋ชจ๋ธ์ SSD ๋ชจ๋ธ ์ด์ ์ ๋์๋ค๊ณ ์ ๋ฒ ํฌ์คํ ์์ ์ ๊น ์ธ๊ธํ์๋ค. YOLO ๋ฒ์ 1์ด ์ด๋ค ๋ชจ๋ธ์ด๊ณ ๋ ์ด๋ค ๋ฌธ์ ์ ์ด ์์๋์ง, ๊ทธ๋ฆฌ๊ณ ๋ฒ์ 2, 3 ๋ชจ๋ธ๊น์ง ์ฐจ๋ก๋๋ก ์ดํด๋ณด์.
์์ผ๋ก ์๊ฐํ YOLO ๋ชจ๋ธ ์ข ๋ฅ๋ค์ ๋ชจ๋ ํ๋์ ๊ณตํต์ ์ ๊ฐ์ง๊ณ ์๋ค. ๋ฐ๋ก ์ ๋ ฅ ์ด๋ฏธ์ง ๋๋ Feature Map์ ํน์ ๊ทธ๋ฆฌ๋๋ก ๋๋๊ณ ๊ฐ Cell ๋ง๋ค Object Detection์ ์ํํ๋ ๊ฒ์ด๋ค. ์ ๋ฒ SSD ๋ชจ๋ธ์์ ๋ฐฐ์ ๋ Feature Map์ ๊ฐ ํฌ์ธํธ๋ง๋ค Object Detection์ ์ํํ๋ ์๋ฆฌ์ ๋์ผํ๋ค. ๊ทธ๋ฆฌ๋์ ๊ฐ Cell์ด ๋ฌด์์ ์๋ฏธํ๋์ง ์ ๋ชจ๋ฅด๋ ์ฌ๋๋ ์์ ์ ์๊ธฐ์ ํ๋จ์ ๊ทธ๋ฆผ์ ์ฐธ์กฐํด์ ์ง๊ด์ ์ผ๋ก ์ดํดํด๋ณด์.
1. YOLO - Version 1
YOLO ๋ฒ์ 1 ๋ชจ๋ธ์ ์ปจ๋ณผ๋ฃจ์ ์ ๊ฑฐ์น Feature Map์ด ์๋ ์ ๋ ฅ ์ด๋ฏธ์ง ์์ฒด๋ฅผ ํน์ ๊ทธ๋ฆฌ๋ S x S๋ก ๋๋๋ค. ๊ทธ๋ฆฌ๊ณ ๋๋ ๊ทธ๋ฆฌ๋์ ๊ฐ Cell ๋ง๋ค Anchor Box๋ฅผ 2๊ฐ์ฉ ์์ฐ๊ณ ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก Ground Truth์ ๋น๊ต๋ฅผ ํ๋ฉด์ Object Detection์ ์ํํ๋ค. ์ฐ์ ๊ตฌ๊ธ์์ YOLO Version 1์ ๊ฒ์ํ์ ๋ ๋์ค๋ ๋ชจ๋ธ์ ์ํคํ ์ฒ๋ฅผ ์ดํด๋ณด์.
์ด์ ํ์๊ฐ ์ง์ ๋ง๋ ์ํคํ ์ฒ๋ฅผ ์ดํด๋ณด์.
๋ชจ๋ธ์ด ์ ๊ฐ๋๋ ๊ณผ์ ์ ๋ํด์ ์ฌ๋งํ ์ค๋ช ์ ์๋ฃ์์ ๋ค ์ ์ด๋์๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก YOLO ๋ฒ์ 1 ๋ชจ๋ธ์ ์ ๋ ฅ ์ด๋ฏธ์ง๋ฅผ 7 x 7 ๊ทธ๋ฆฌ๋๋ก ๋๋๊ณ ๋๋ ๊ฐ Cell ๋น ํ๋์ Object Detection์ ์ํํ๊ณ ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ํตํฉํด์ ์ต์ข ์ ์ธ Object Detection์ ์ํํด์ฃผ๋ ๊ฒ์ด๋ค.
์ ์๋ฃ์ ๋นจ๊ฐ์ 1 x 1 x 30 ๋ฒกํฐ๋ฅผ ์ค๋ช ํด ๋์ ๋ถ๋ถ์ ๋ณด์. ํ๋์ Anchor Box์ ๋ํ ๋ฒกํฐ 5๊ฐ. ์ด Box๊ฐ 2๊ฐ๊ฐ ์์ผ๋ฏ๋ก ์ด 10๊ฐ, ๊ทธ๋ฆฌ๊ณ Pascal VOC Dataset ๊ธฐ์ค์ผ๋ก ํด๋์ค ์ข ๋ฅ๊ฐ 20๊ฐ์ด๊ธฐ ๋๋ฌธ์ 20๊ฐ์ ๋ฒกํฐ, ์ด๋ค์ ํฉํ๋ฉด ์ด 30๊ฐ์ ๋ฒกํฐ๊ฐ ๋๋ ๊ฒ์ ๋ณผ ์ ์๋ค.
์ด๋ ๊ฒ ํ๋์ Cell ๋ง๋ค Object Detection์ ์ํํด์ฃผ๊ณ ๋๋ฉด ์๋ง์ Bounding Box๋ค์ด ๋์ถ๋ ๊ฒ์ด๋ค. ์ด ๋ Ground Truth์ ์ต๋ํ ์ ์ฌํ ์ต์ ์ Bounding Box๋ค ๋ง์ ๋จ๊ธฐ๊ธฐ ์ํด NMS ๊ณผ์ ์ ์ํํด์ค๋ค.
ํ์ง๋ง YOLO ๋ฒ์ 1 ๋ชจ๋ธ์ ์น๋ช ์ ์ธ ๋จ์ ์ด ์๋ค. ๋ฐ๋ก ๊ทธ๋ฆฌ๋๋ฅผ ๋๋ ๊ฐ Cell ๋ง๋ค Anchor Box๊ฐ 2๊ฐ๋ฐ์ ์๋ค๋ ๊ฒ์ด๋ค. ๊ฒฐ๊ตญ Anchor Box๊ฐ 2๊ฐ๋ผ๋ฉด ๊ทธ๋งํผ ROI(Regions Of Interest, ๊ฐ์ฒด๊ฐ ์์๋งํ ํ๋ณด ์์ญ)๋ค์ด ์ ์ ๊ฒ์ด๊ณ ์ด๋ ๊ฒฐ๊ตญ Object๋ฅผ ์ ํ์งํ์ง ๋ชปํ๊ฒ ๋๋ ๋ฌธ์ ๊ฐ ๋ฐ์ํ๋ค. ๋ํ ์ ๋ ฅ ์ด๋ฏธ์ง๋ฅผ ๊ทธ๋ฆฌ๋ ์ ๋ก ๋๋๊ณ ๊ฐ Cell ๋ง๋ค Object Detection์ ์ํํ๊ธฐ ๋๋ฌธ์ ๋ง์ฝ ํ๋์ ๊ทธ๋ฆฌ๋ Cell์ ์ฌ๋ฌ๊ฐ Object๊ฐ ๊ฒน์ณ์์ผ๋ฉด ๋จ์ํ ํ๋์ Object๋ก๋ง ํ์งํ๊ณ ๋์ด๊ฐ๋ค๋ ๊ฒ์ด๋ค. ๋ฐ๋ก ํ๋จ์ ์ฌ์ง์ฒ๋ผ ๋ง์ด๋ค.
2. YOLO - Version 2
์ด์ YOLO ๋ฒ์ 2 ๋ชจ๋ธ์ ์ดํด๋ณด์. ๋ฒ์ 1์ ๋ฌธ์ ์ ์ ํด๊ฒฐํ๊ธฐ ์ํด์ ๋ฒ์ 2์์๋ ๋ค์๊ณผ ๊ฐ์ ํน์ง๋ค์ ๋ชจ๋ธ์ ์ถ๊ฐํ๋ค.
- ์ ๋ ฅ ์ด๋ฏธ์ง๊ฐ ์๋ Feature Map์์ 13 x 13 ๊ทธ๋ฆฌ๋๋ก ๋๋๊ณ ๊ฐ Cell ๋ง๋ค Object Detection์ ์ํ
- ๊ฐ Cell ๋น ์์ฐ๋ Anchor Box ๊ฐ์๋ฅผ 5๊ฐ๋ก ๋๋ฆฌ๊ธฐ
- ๋์ผํ ์ด๋ฏธ์ง ์ด์ง๋ง ํฌ๊ธฐ๋ง ๋ค๋ฅด๊ฒ ํด์ ๋ชจ๋ธ์ ํ์ต(Multi-Scaling)
- ๋ชจ๋ธ์ Batch Normalization ์ ์ฉ
- ๋ถ๋ฅ ๋ชจ๋ธ์ Fine Tuning
- Darknet-19 ๋ผ๋ ๊ฐ๋ณ์ Feature Extractor ์ฌ์ฉ
๋ฒ์ 2 ๋ชจ๋ธ์์ ์ฃผ๋ชฉํด์ผ ํ ํน์ง์ 1๋ฒ, 2๋ฒ์ด ๋๊ฒ ๋ค. ๋๋จธ์ง ํน์ง๋ค์ ์ฝ๊ธฐ๋ง ํด๋ ์ดํด๊ฐ ๋ ๊ฒ์ด๋ค. ์ฐ์ ๊ธฐ๋ณธ์ ์ธ YOLO ๋ฒ์ 2์ ์ํคํ ์ฒ๋ฅผ ์ดํด๋ณด์.
๋ฒ์ 1 ๋ชจ๋ธ๊ณผ ๋๋๋ฌ์ง ์ฐจ์ด์ ์ FC Layer๊ฐ ์์ด์ก๋ค๋ ์ ์ด๋ค. ๊ทธ๋ฆฌ๊ณ ์ ๋ ฅ ๋ฐ์ดํฐ๊ฐ ์๋ Feature Map์์ 13 x 13 ๊ทธ๋ฆฌ๋๋ก ๋๋๊ณ ๊ฐ Cell ๋ง๋ค Object Detection์ ์ํํ๋ค๋ ์ ์ด๋ค. ์, ์ด์ ๋ํ ์ผํ๊ฒ ์ค๋ช ํ๋ ์๋ฃ๋ฅผ ์ดํด๋ณด์
์ ๊ทธ๋ฆผ์ ๋ณด๋ค์ํผ ์ ๊ฐ๋๋ ๊ณผ์ ์ ๋ฒ์ 1 ๋ชจ๋ธ๊ณผ ์ ์ฌํ๋ค. Feature Map์ ๊ทธ๋ฆฌ๋๋ฅผ ๋๋๋ค๋ ์ ๊ณผ ๊ฐ ๊ทธ๋ฆฌ๋ Cell ๋ง๋ค Anchor Box๋ฅผ 2๊ฐ๊ฐ ์๋ 5๊ฐ๋ฅผ ์์์ค๋ค๋ ์ ์ด ๋ค๋ฅด๋ค. ๊ทธ๋ฐ๋ฐ ์ฌ๊ธฐ์ Anchor Box๋ฅผ 5๊ฐ ์์์ค ๋ ์๋ก ๋ค๋ฅธ ํฌ๊ธฐ์ ๋ฐ์ค๋ค์ ์์์ค๋ค๊ณ ํ๋ค. ๊ทธ๋ฌ๋ฉด ์๋ก ๋ค๋ฅธ ์ ์ ํ ํฌ๊ธฐ๋ฅผ ์ด๋ป๊ฒ ์ค์ ํด์ค๊น?
5๊ฐ์ ์๋ก ๋ค๋ฅธ Anchor Box์ ์ฌ์ด์ฆ ๊ธฐ์ค์ ์ ๋ ฅ๋๋ ์ด๋ฏธ์ง ๋ฐ์ดํฐ์ Ground Truth์ Bouding Box๋ฅผ ๋ถ์ํด ๋น์ทํ ๋ถ๋ถ๋ผ๋ฆฌ ๊ทธ๋ฃนํ๋๋๋ก K-means Clustering์ ์ฌ์ฉํ๊ฒ ๋๋ค.
๊ฒฐ๊ณผ์ ์ผ๋ก ํ๋์ ๊ทธ๋ฆฌ๋ Cell์ ๋ํด 125๊ฐ์ ๋ฒกํฐ๊ฐ ์กด์ฌํ๊ฒ ๋๋ค. ํ๋์ Anchor Box๋น 25๊ฐ์ ๋ฒกํฐ๊ฐ ์กด์ฌํ๊ณ Anchor Box๊ฐ 5๊ฐ๊ฐ ์์ผ๋๊น $25 * 5$์ธ 125๊ฐ ๋๋ค.
3. YOLO - Version 3
YOLO ๋ฒ์ 2 ๋ชจ๋ธ๋ก ๋ฒ์ 1์ ๋นํด ํ์ง ์๋์ ํ์ง ์ฑ๋ฅ์ ๋ํญ ๊ฐ์ ํ๋ค. ๊ทธ๋ฐ๋ฐ YOLO ์ฐ๊ตฌ์๋ถ๋ค์ ์ฌ๊ธฐ์ ๋ฉ์ถ์ง(?) ์์๋ค. ๋ฒ์ 2 ๋ชจ๋ธ์ ๋นํด ํ์ง ์๋๋ ์ฝ๊ฐ ๋๋ ค์ก์ง๋ง ํ์ง ์ฑ๋ฅ์ ๋ ๋ํญ ๊ฐ์ ํ ๋ฒ์ 3 ๋ชจ๋ธ์ด ๊ฐ๋ฐ๋๋ค. ๋ฒ์ 3 ๋ชจ๋ธ์ ํน์ง์ ๋ค์๊ณผ ๊ฐ๋ค.
- SSD์ Multi-Scale Feature Layer์ ์ ์ฌํ ๊ธฐ๋ฒ์ ์ ์ฉ
- Multi-label Classification์ ํด๊ฒฐํ๊ธฐ ์ํด ํด๋์ค ๋ถ๋ฅ ์ Softmax๊ฐ ์๋ ๋ ๋ฆฝ์ ์ธ ์ฌ๋ฌ๊ฐ์ Sigmoid Layer๋ฅผ ์ฌ์ฉ
- ํ๋์ ๊ทธ๋ฆฌ๋ Cell ๋น 3๊ฐ์ Anchor Box๋ฅผ ์์
- ํด๋์ค ์ข ๋ฅ๊ฐ 80๊ฐ์ธ COCO Dataset์ ์ฌ์ฉ
- Darknet-53 ์ด๋ผ๋ ๊ฐ๋ณ Feature Extractor๋ฅผ ์ฌ์ฉ
- ๋์ผํ์ง๋ง ์ฌ์ด์ฆ๋ง ๋ค๋ฅธ ์ด๋ฏธ์ง๋ค์ ํ์ต(Multi-Scaling), Data Augmentation ์ฌ์ฉ
- Layer ์ค๊ฐ์ Feature Map ์ฌ์ด์ฆ ์ถ์๋ฅผ ๋ง๊ธฐ ์ํ Up Sampling ์ฌ์ฉ
- Resnet๊ณผ ๊ฐ์ด Gradient Vanishing์ ๋ฐฉ์งํ๊ธฐ ์ํด Skip Connection์ ์ฌ์ฉ
์ ์ฌ๋ฌ๊ฐ์ง ํน์ง ์ค 1, 2๋ฒ์ ๋ํด์๋ง ์์ธํ ์ค๋ช ํ๋ ค๊ณ ํ๋ค.
3-1. SSD์ Multi-Scale Feature Layer ์์ด๋์ด๋ฅผ ๋น๋ ค๋ณด์!
๋ฒ์ 2 ๋ชจ๋ธ๊ณผ ๊ฐ์ฅ ํฐ ์ฐจ์ด์ ์ค ํ๋๋ SSD ๋ชจ๋ธ์์ Multi-Scale Feature Layer์ ์ถํ์ Retinanet์์ ์ดํด๋ณผ FPN(Feature Pyramid Network)๊ณผ ์ ์ฌํ ๊ธฐ๋ฒ์ ์ ์ฉํ๋ค๋ ๊ฒ์ด๋ค. ์์ง Retinanet์ ๋ฐฐ์ฐ์ง ์์์ผ๋ SSD์ Multi-Scale Feature Layer์ ๋ํด ๋ค์ ์๊ธฐํด๋ณด์. ์ด๊ฒ์ ์๋ก ๋ค๋ฅธ ํฌ๊ธฐ์ Feature Map์ ๊ฐ ํฌ์ธํธ๋ง๋ค Object Detection์ ์ํํด์ฃผ๋ ๊ธฐ๋ฒ์ด์๋ค.
YOLO ๋ฒ์ 3 ๋ชจ๋ธ์ ์ด Multi-Scale Feature Layer๋ฅผ ๊ทธ๋ฆฌ๋์ ์ ์ฉํด์ฃผ๋ ์ ์ด๋ค. ์ฐ์ ํฐ ์ํคํ ์ฒ๋ถํฐ ์ดํด๋ณด์.
์ ๊ทธ๋ฆผ์ ๋ณด๋ค์ํผ ๋ฒ์ 3 ๋ชจ๋ธ์ 82๋ฒ์งธ, 94๋ฒ์งธ, 106๋ฒ์งธ Layer์ Feature Map์์ ๊ฐ๊ฐ ์๋ก ๋ค๋ฅธ ํฌ๊ธฐ์ ๊ทธ๋ฆฌ๋๋ก ๋๋๊ณ ๊ฐ Cell ๋ง๋ค Object Detection์ ์ํํ๋ค. ํ๋จ์ ์๋ฃ๋ ์ ๊ทธ๋ฆผ์ ์ ์ฒด ๊ตฌ์กฐ๋ณด๋ค ๊ฐ๊ธฐ ๋ค๋ฅธ Feature Map์ Multi-Scale Feature Layer๋ฅผ ์ฌ์ฉํ๋ ๋ถ๋ถ์ ์ง์คํด์ ์๋ฃ๋ฅผ ๋ง๋ค์๋ค๋ ์ ์ ์ฐธ๊ณ ํด์ฃผ๋ฉด ์ข๊ฒ ๋ค.
YOLO ๋ฒ์ 3 ๋ชจ๋ธ์ ์์ Multi-Scale Feature Layer ๊ธฐ๋ฒ์ ์ฌ์ฉํด ๊ทธ๋ฆฌ๋ ์ฌ์ด์ฆ๊ฐ ์์ ๋๋ Anchor Box ํฌ๊ธฐ๊ฐ ์ปค์ง๋ฏ๋ก ์๋์ ์ผ๋ก ํฐ ๊ฐ์ฒด๋ฅผ, ๊ทธ๋ฆฌ๋ ์ฌ์ด์ฆ๊ฐ ํด ๋๋ Anchor Box ํฌ๊ธฐ๊ฐ ์์์ง๋ฏ๋ก ์๋์ ์ผ๋ก ์์ ๊ฐ์ฒด๋ฅผ ์ ํ์งํ๋๋ก ํ๊ธฐ ์ํด ๊ตฌํ๋์๋ค.
3-2. ๋ ๋ฆฝ์ ์ธ ์ฌ๋ฌ๊ฐ์ Sigmoid๋ก Multi-label Classification ํด๊ฒฐ
ํด๋น ๋ด์ฉ์ ์ดํดํ๊ธฐ ์ ์ Multi-label Classification๊ณผ Multi-class Classification์ ์ฐจ์ด์ ์ ์ดํดํด์ผ ํ๋ค.
- Multi-label Classification : ๋์์ ์ฌ๋ฌ๊ฐ์ ๋ ์ด๋ธ์ ๊ฐ์ง ์ ์๋ค. ์๋ฅผ ๋ค์ด '๋จ์(๋ ์ด๋ธ1), ์ฌ๋(๋ ์ด๋ธ2)' ๋ฅผ ๋์์ ๊ฐ์ง ์ ์๋ค.
- Multi-class Classification : ๋ฌด์กฐ๊ฑด์ ์ผ๋ก ํ๋์ ๋ ์ด๋ธ๋ง ๊ฐ์ง ์ ์๋ค. ์๋ฅผ ๋ค์ด '๋จ์(๋ ์ด๋ธ1)' ๋๋ '์ฌ๋(๋ ์ด๋ธ2)' ๋ ์ค ํ๋๋ง ๊ฐ์ง ์ ์๋ค.
๊ทธ๋์์ Object Detection ๋ชจ๋ธ์ ๊ฐ์ฒด์ ์ต์ข ํด๋์ค ๋ถ๋ฅ๋ฅผ ์ํด ๋ชจ๋ ํด๋์ค์ ํ๋ฅ ๊ฐ์ ๋ํ๋ฉด ๋ฌด์กฐ๊ฑด 1์ด ๋๋ Softmax Layer๋ฅผ ์ฌ์ฉํ๋ค. ์ฆ, Multi-class Classification ๋ฌธ์ ๋ง์ ํด๊ฒฐํ๋ค. ํ์ง๋ง YOLO ๋ฒ์ 3 ๋ชจ๋ธ์ ์ต์ข ํด๋์ค๋ฅผ ๋ถ๋ฅํ ๋ Softmax Layer๊ฐ ์๋ ๊ฐ ํด๋์ค ๋ง๋ค Sigmoid(=Logisitc ํจ์) Layer๋ฅผ ์ฌ์ฉํด Multi-label Classification์ ํด๊ฒฐํ ์ ์๋ค.
์๋ฅผ ํ๋๋ง ๋ค์ด๋ณด์. '๋จ์'๋ผ๋ ๊ฐ์ฒด๊ฐ ๋ค์ด์๋ ์ด๋ฏธ์ง๊ฐ YOLO ๋ฒ์ 3 ๋ชจ๋ธ๋ก ์ ๋ ฅ๋์๋ค. ๊ทธ๋ฆฌ๊ณ ์ฃผ์ด์ง ํด๋์ค ์ข ๋ฅ๋ [์ฌ๋, ๋จ์, ๊ฐ์์ง]๋ผ๊ณ ํด๋ณด์. ์ด ๋ Softmax Layer๋ฅผ ์ฌ์ฉํ๊ฒ ๋๋ฉด ๊ฐ ํด๋์ค์ ๋ํ ํ๋ฅ Score๊ฐ ๋๋ต [0.3, 0.6, 0.1]๊ฐ ๋ ๊ฒ์ด๋ค. ์ฆ, ์ธ ๊ฐ์ ์ด ํฉ์ 1์ด ๋๋ค. ๊ทธ๋ ๊ธฐ ๋๋ฌธ์ ์์ธก ๋ชจ๋ธ์ ๊ฐ์ฅ Score๊ฐ ๋์ 0.6์ธ '๋จ์'๋ก๋ง ์์ธกํ ๊ฒ์ด๋ค.
ํ์ง๋ง ์ฌ๊ธฐ์ ๊ฐ ํด๋์ค ๋ง๋ค ๋ ๋ฆฝ์ ์ธ Sigmoid Layer๋ฅผ ์ฌ์ฉํ๊ฒ ๋๋ฉด Score๋ [0.8, 0.8, 0.2] ์ ๋๊ฐ ๋ ๊ฒ์ด๋ค. ๊ฒฐ๊ตญ Score์ ๊ฐ ํ๋์ฉ ๋ถ๋ฅ ๊ฒฐ์ ์๊ณ๊ฐ(์ฌ๊ธฐ์ 0.5๋ผ๊ณ ํ์)๊ณผ ๋น๊ตํด์ ํฌ๋ฉด 1, ์์ผ๋ฉด 0์ผ๋ก ๋ถ๋ฅํ๊ฒ ๋จ์ ๋ฐ๋ผ Multi-label๋ก ์์ธกํ๊ฒ ๋๋ค. ๋ค์ ๋งํด ์ ๋ ฅ๋ ์ด๋ฏธ์ง๋ '์ฌ๋' ์ด๋ฉด์ '๋จ์' ์ธ 2๊ฐ์ ๋ ์ด๋ธ์ ๊ฐ๋๋ก ์์ธกํ๊ฒ ๋๋ค.
์ง๊ธ๊น์ง YOLO์ ์ฌ๋ฌ ๋ฒ์ ๋ชจ๋ธ์ ๋ํด ์์๋ณด์๋ค. ํด๋น ํฌ์คํ ์์๋ ๋ฒ์ 3๊น์ง ์์๋ณด์์ง๋ง ๊ตฌ๊ธ๋ง์ ํด๋ณด๋ ํ์ฌ(2021๋ 4์ 22์ผ) ๊ธฐ์ค์ผ๋ก YOLO ๋ฒ์ 5๊น์ง ๋ชจ๋ธ์ด ๋์จ ๋ฏ ํ๋ค.
'Data Science > Computer Vision' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ML] Mask RCNN Instance Segmentation ๋ชจ๋ธ (0) | 2021.05.06 |
---|---|
[ML] Retina Net Object Detection ๋ชจ๋ธ (0) | 2021.04.26 |
[ML] SSD(Single Shot Detector) Object Detection ๋ชจ๋ธ (0) | 2021.04.20 |
[ML] '๋ ๋น ๋ฅธ' Faster RCNN Object Detection ๋ชจ๋ธ (0) | 2021.04.18 |
[ML] Fast RCNN Object Detection ๋ชจ๋ธ (0) | 2021.04.13 |