2019년 1월 10일
YOLO (You Only Look Once)
I. 인공신경방 빠른 객체 탐색, YOLO
개념 | 필요성 |
---|---|
빠른 속도로 객체 탐색 위해 그리드 Bounding box를 통해 최적 객체 탐색 및 분류하는 딥러닝 기반 Fast 객체 탐색 | – RCNN의 느린 속도 개선 – 전체 이미지 기반 맥락이해 – Object의 일반화 특징학습 |
II. YOLO의 객체 탐색/분류 절차 및 구현 기술
가. YOLO 기반 객체 탐색/분류 수행 절차
# | 수행 절차 | 설명 |
---|---|---|
① | Grid 구성 | – Input Image를 S x S grid로 구성 – grid 기반 객체 인식 |
② | Bounding Box 초기화 | – 각 grid cell은 B개 Bounding Box와 Confidence Score 초기화 |
③ | 객체 위치, box 크기 구분 | – 각 Bounding Box 별 중심 위치, box 크기 결정, CNN 수행 |
④ | box별 신뢰도 계산 | – 각 Bounding Box 별 x, y, w, h 신뢰도 계산하여 분류 |
나. YOLO를 구현하기 위한 주요 기술
구분 | 기술 요소 | 설명 |
---|---|---|
객체탐색 기술 | Grid | – Image를 S x S 격자로 구성 – 인접 grid기반 객체 인식 |
Bounding Box | – 객체 경계 결정 알고리즘 – x, y, w, h, Confidence Score | |
Darknet | – 신경망 실행 프레임워크 – CUDA, OpenCV 영상처리 | |
객체분류 기술 | CNN | – Convolutional Layer – Pooling, Connected Layer |
Confidence Score | – 각 B-Box Grid cell 신뢰수치 – Pr(Object) x IOU | |
Class Probability | – Loss 기법 기반 분류 예측 – 확률: Pr(Class|Object) |
- YOLO 기법은 속도가 빠르지만 동일 cell에 여러 객체 존재 시 인식률 저하 발생
III. YOLO의 기술적 한계점 및 고려사항
한계점 | 고려사항 |
---|---|
– 각 cell은 하나의 클래스만 예측 – Training Data 통한 학습만 가능 – 예측 시 Localization 부정확 | – Fast R-CNN과 함께 사용하여 보완 가능 |
- 간결하고 빠른 속도의 장점으로 활발한 연구 진행중