YOLO (You Only Look Once)

I. 인공신경방 빠른 객체 탐색, YOLO

개념필요성
빠른 속도로 객체 탐색 위해 그리드 Bounding box를 통해 최적 객체 탐색 및 분류하는 딥러닝 기반 Fast 객체 탐색RCNN의 느린 속도 개선
– 전체 이미지 기반 맥락이해
– Object의 일반화 특징학습

 

II. YOLO의 객체 탐색/분류 절차 및 구현 기술

가. YOLO 기반 객체 탐색/분류 수행 절차

#수행 절차설명
Grid 구성– Input Image를 S x S grid로 구성
– grid 기반 객체 인식
Bounding Box 초기화– 각 grid cell은 B개 Bounding Box와 Confidence Score 초기화
객체 위치, box 크기 구분– 각 Bounding Box 별 중심 위치, box 크기 결정, CNN 수행
box별 신뢰도 계산– 각 Bounding Box 별 x, y, w, h 신뢰도 계산하여 분류

나. YOLO를 구현하기 위한 주요 기술

구분기술 요소설명
객체탐색
기술
Grid– Image를 S x S 격자로 구성
– 인접 grid기반 객체 인식
Bounding Box– 객체 경계 결정 알고리즘
– x, y, w, h, Confidence Score
Darknet– 신경망 실행 프레임워크
– CUDA, OpenCV 영상처리
객체분류
기술
CNN– Convolutional Layer
– Pooling, Connected Layer
Confidence
Score
– 각 B-Box Grid cell 신뢰수치
– Pr(Object) x IOU
Class
Probability
– Loss 기법 기반 분류 예측
– 확률: Pr(Class|Object)
  • YOLO 기법은 속도가 빠르지만 동일 cell에 여러 객체 존재 시 인식률 저하 발생

 

III. YOLO의 기술적 한계점 및 고려사항

한계점고려사항
– 각 cell은 하나의 클래스만 예측
– Training Data 통한 학습만 가능
– 예측 시 Localization 부정확
– Fast R-CNN과 함께 사용하여 보완 가능
  • 간결하고 빠른 속도의 장점으로 활발한 연구 진행중

콘텐츠 사용 시 출처 표기 부탁 드리고, 댓글은 큰 힘이 됩니다^^