1. 인공신경방 빠른 객체 탐색, YOLO
| 개념 | 필요성 |
|---|---|
| 빠른 속도로 객체 탐색 위해 그리드 Bounding box를 통해 최적 객체 탐색 및 분류하는 딥러닝 기반 Fast 객체 탐색 기법 | – RCNN의 느린 속도 개선 – 전체 이미지 기반 맥락이해 – Object의 일반화 특징학습 |
2. YOLO의 객체 탐색/분류 절차 및 구현 기술
(1) YOLO 기반 객체 탐색/분류 수행 절차
| # | 수행 절차 | 설명 |
|---|---|---|
| ① | Grid 구성 | – Input Image를 S x S grid로 구성 – grid 기반 객체 인식 |
| ② | Bounding Box 초기화 | – 각 grid cell은 B개 Bounding Box와 Confidence Score 초기화 |
| ③ | 객체 위치, box 크기 구분 | – 각 Bounding Box 별 중심 위치, box 크기 결정, CNN 수행 |
| ④ | box별 신뢰도 계산 | – 각 Bounding Box 별 x, y, w, h 신뢰도 계산하여 분류 |
(2) YOLO를 구현하기 위한 주요 기술
| 구분 | 기술 요소 | 설명 |
|---|---|---|
| 객체탐색 기술 | Grid | – Image를 S x S 격자로 구성 – 인접 grid기반 객체 인식 |
| Bounding Box | – 객체 경계 결정 알고리즘 – x, y, w, h, Confidence Score | |
| Darknet | – 신경망 실행 프레임워크 – CUDA, OpenCV 영상처리 | |
| 객체분류 기술 | CNN | – Convolutional Layer – Pooling, Connected Layer |
| Confidence Score | – 각 B-Box Grid cell 신뢰수치 – Pr(Object) x IOU | |
| Class Probability | – Loss 기법 기반 분류 예측 – 확률: Pr(Class|Object) |
- YOLO 기법은 속도가 빠르지만 동일 cell에 여러 객체 존재 시 인식률 저하 발생
3. YOLO의 기술적 한계점 및 고려사항
| 한계점 | 고려사항 |
|---|---|
| – 각 cell은 하나의 클래스만 예측 – Training Data 통한 학습만 가능 – 예측 시 Localization 부정확 | – Fast RCNN과 함께 사용하여 보완 가능 |
- 간결하고 빠른 속도의 장점으로 활발한 연구 진행중