2019년 1월 8일
RCNN (Region-based CNN)
I. 영상 내 사물 인식, R-CNN(Region-based CNN)
- 입력 영상 내 사물 인식을 위해 사물의 영역 탐지 및 사물 특징 추출, 분류 CNN 기반 신경망 알고리즘
II. R-CNN의 구성도 및 구성요소
가. R-CNN의 구성도
① 이미지 입력 ② 2000개 정도 Region Proposal 추출(Selective Search) ③ Cropping(자르기), Warping(크기 동일화), Feature 추출 ④ 각 Region Proposal Feature 대한 분류 수행 |
나. R-CNN 구현을 위한 알고리즘
알고리즘 | 핵심기술 | 알고리즘 설명 |
---|---|---|
Sliding Window | 전체 영역 탐색 | – 화면 내 전체 Sliding Scan – 탐색 영역 과다, 연산 증가 |
EdgeBoxes | 탐지 영역 수 감소 | – 에지 정보 기반 에지박스 – 영역 감소, 연상 성능 향상 |
Selective Search | 픽셀 통합 | – Low Level Feature 기반 – Super Pixel 통합 기법 |
Bounding-Box Regression | 위치 변환 | – 탐지된 영역의 사물 중앙화 – 영역 P의 위치 d(P)x → G |
- RCNN은 탐색된 영역 대상 Feature 추출, 분류 수행하므로 정확하지만 연산 시간 과다 소요
III. R-CNN 한계점에 따른 해결 방안
한계점 | 해결 방안 |
---|---|
– 탐색 영역 마다 CNN 수행하므로 연산시간 과다 소요 – 2000 영역 → 2000번 수행 | – SPP-net 기반 Fast RCNN – CNN 선 수행(1회) 후 SPP/Rol 기반 Pooling |
- F-RCNN은 Region Proposal 시 외부 알고리즘 사용하여 병목현상이 발생하므로 CNN 내부 Region Proposal 설계로 해결