728x90

요약

- 합성곱 신경망은 계층적 특징을 구하는 유용한 시각 모델인데, 이번에 end-to-end로 학습시켜 pixel-to-pixel의 결과를 내는 시멘틱세그먼테이션 분야의 최신 합성곱 신경망 모델을 소개하고자 한다.

- 여기서 중요한 개념으로 "완전 합성곱" 신경망을 만들었는데 임의의 크기의 입력을 받아 그 크기에 맞는 출력을 낸다.

- 여기서는 완전 합성곱 신경망에 대해서 자세히 소개하고, 공간적인 밀집 예측(픽셀 단위)에 사용하였습니다.

- 현세대의 분류 신경망인 알렉스넷, VGG, 구글넷을 완전 합성곱 신경망에 적용시켜, 세그먼테이션 작업에 미세조정시켰습니다.

- 그러고나서 심층의 시멘틱 정보와 깊고 거친 레이어로부터 얻은 시멘틱 정보와 얕고 미세한 층으로부터 얻은 외영 정보를 혼합하여 정확하고 자세한 세그먼테이션 결과를 만드는 새로운 아키텍처를 만들었습니다.

- 우리가 만든 완전 합성곱 신경망은 PASCAL VOC 세그먼테이션에서 최신 성능으로 2012년 62.2% mean IU보다 20%정도 개선되었으며(NYUDv2, SIFT Flow 에서도), 일반적인 이미지를 추론하는데 1/5초 이하로 처리하였습니다.

300x250

+ Recent posts