2019년 1월 10일

YOLO (You Only Look Once)

I. 인공신경방 빠른 객체 탐색, YOLO

개념	필요성
빠른 속도로 객체 탐색 위해 그리드 Bounding box를 통해 최적 객체 탐색 및 분류하는 딥러닝 기반 Fast 객체 탐색	– RCNN의 느린 속도 개선 – 전체 이미지 기반 맥락이해 – Object의 일반화 특징학습

II. YOLO의 객체 탐색/분류 절차 및 구현 기술

가. YOLO 기반 객체 탐색/분류 수행 절차

#	수행 절차	설명
①	Grid 구성	– Input Image를 S x S grid로 구성 – grid 기반 객체 인식
②	Bounding Box 초기화	– 각 grid cell은 B개 Bounding Box와 Confidence Score 초기화
③	객체 위치, box 크기 구분	– 각 Bounding Box 별 중심 위치, box 크기 결정, CNN 수행
④	box별 신뢰도 계산	– 각 Bounding Box 별 x, y, w, h 신뢰도 계산하여 분류

나. YOLO를 구현하기 위한 주요 기술

구분	기술 요소	설명
객체탐색 기술	Grid	– Image를 S x S 격자로 구성 – 인접 grid기반 객체 인식
	Bounding Box	– 객체 경계 결정 알고리즘 – x, y, w, h, Confidence Score
	Darknet	– 신경망 실행 프레임워크 – CUDA, OpenCV 영상처리
객체분류 기술	CNN	– Convolutional Layer – Pooling, Connected Layer
	Confidence Score	– 각 B-Box Grid cell 신뢰수치 – Pr(Object) x IOU
	Class Probability	– Loss 기법 기반 분류 예측 – 확률: Pr(Class\|Object)

YOLO 기법은 속도가 빠르지만 동일 cell에 여러 객체 존재 시 인식률 저하 발생

III. YOLO의 기술적 한계점 및 고려사항

한계점	고려사항
– 각 cell은 하나의 클래스만 예측 – Training Data 통한 학습만 가능 – 예측 시 Localization 부정확	– Fast R-CNN과 함께 사용하여 보완 가능

간결하고 빠른 속도의 장점으로 활발한 연구 진행중

Tags:Bounding Box, Grid, 그리드, You Only Look Once, Darknet, CNN, 다크넷, RCNN, Confidence Score, YOLO, Class Probability, 영상인식, CUDA, 인공지능 영상인식, OpenCV, 신속한 객체 탐색

About The Author

도리

콘텐츠 사용 시 출처 표기 부탁 드리고, 댓글은 큰 힘이 됩니다^^응답 취소