728x90

arxiv.org/abs/1311.2524

 

 

1. 초록

1.1 현뢍

- 기존의 PASCAL VOC 데이터셋으로 측정한 물체 탐지 성능은 이전 몇년간 큰 변화는 없었었다.

- 최고의 성능을 보였던 방법은 고 수준 컨텍스트와 여러 저수준 이미지 특징들을 혼합시킨 복잡한 앙상블 시스템이었다.

 

1.2 성과

- 본 논문에서는 단순하고, 유연한(scalable) 물체 검출 알고리즘을 제안하는데, mean average precision(mAP)가 이전의 VOC 2012에서 mAP 53.3%로 최고 성능을 보였던것에서 30% 증가하였다.

 

1.3 특징

- 우리가 제안한 방법은 두가지 핵심 개념을 가지고 있는데, 첫번째는 제안된 영역에다가 합성곱 신경망을 적용하여 물체를 구분하고 위치를 찾아냅니다. 두 번째는 라벨링된 훈련셋 자체가 적은 경우 영역 단위로 미세조정하여 성능을 크게 끌어올릴수 있었습니다.

- 영역 제안과 CNN을 결합하였으므로 이 방법을 R-CNN이라 불렀습니다.( CNN 특징들을 가진 영역들)

 

1.4 결과

- R-CNN과 비슷한 CNN 아키텍처에다가 슬라이딩 윈도우 검출기를 기반으로 제안된 OverFeat를 비교하였는데, R-CNN이 ILSVRC2013 검출 데이터셋에서 훨씬 큰 격차로 좋은 성능을 내었습니다.

 

300x250

+ Recent posts