RCNN (Region-based CNN)

I. 영상 내 사물 인식, R-CNN(Region-based CNN)

  • 입력 영상 내 사물 인식을 위해 사물의 영역 탐지 및 사물 특징 추출, 분류 CNN 기반 신경망 알고리즘
     

II. R-CNN의 구성도 및 구성요소

가. R-CNN의 구성도

① 이미지 입력
② 2000개 정도 Region Proposal 추출(Selective Search)
③ Cropping(자르기), Warping(크기 동일화), Feature 추출
④ 각 Region Proposal Feature 대한 분류 수행

나. R-CNN 구현을 위한 알고리즘

알고리즘핵심기술알고리즘 설명
Sliding Window전체 영역
탐색
– 화면 내 전체 Sliding Scan
– 탐색 영역 과다, 연산 증가
EdgeBoxes탐지 영역
수 감소
– 에지 정보 기반 에지박스
– 영역 감소, 연상 성능 향상
Selective
Search
픽셀 통합– Low Level Feature 기반
– Super Pixel 통합 기법
Bounding-Box
Regression
위치 변환– 탐지된 영역의 사물 중앙화
– 영역 P의 위치 d(P)x → G
  • RCNN은 탐색된 영역 대상 Feature 추출, 분류 수행하므로 정확하지만 연산 시간 과다 소요

 

III. R-CNN 한계점에 따른 해결 방안

한계점해결 방안
– 탐색 영역 마다 CNN 수행하므로 연산시간 과다 소요
– 2000 영역 → 2000번 수행
– SPP-net 기반 Fast RCNN
– CNN 선 수행(1회) 후 SPP/Rol 기반 Pooling
  • F-RCNN은 Region Proposal 시 외부 알고리즘 사용하여 병목현상이 발생하므로 CNN 내부 Region Proposal 설계로 해결

콘텐츠 사용 시 출처 표기 부탁 드리고, 댓글은 큰 힘이 됩니다^^