SIFT의 한계
SIFT는 좋은 성능을 보이는 특징 검출 알고리즘이지만
bay2006에 따르면
SIFT는 800 x 640 영상에서 400ms
해리스 라플라스는 2100ms가 소요됨.
bay는 2006년 SIFT보다 5~6배 정도 더 빠르게 특징들을 검출할수 있는 SURF를 소개
SURF 개요
SURF는 헤시안 행렬식을 사용.
sigma를 조금씩 증가시켜 3차원 스케일 공간을 만들고, 지역 극점을 찾아 특징점으로 사용.
SURF가 이전 방법과 다른 점은 행렬식을 근사화 하여 사용한다는 점임.
일단 위 해시안 행렬의 원소들은 아래와 같이 정의
d_yy는 sigma 가우시안 스무딩 적용 후 y방향으로 두번 미분하여 구한 영상
이는 y방향으로 2번 미분한 가우시안 마스크를 컨벌루션한것과 같은 결과를 가짐
근사화된 가우시안 마스크 활용
아래의 그림에서 위의것은 가우시안 마스크를 y방향으로 2번 미분하여 구한 마스크(연산자)(1)과
y방향으로 1번 x방향으로 1번 미분하여 구한 마스크(연산자)(2)임
* 가우시안 연산자를 x방향으로 2번 미분한 연산자는 y방향을 2번 미분한것을 90도 회전하여 구할수있음.
아래 그림은 가우시안 마스크를 2번 미분한 연산자를 근사화하여 구한 연산자임
SURF에서는 아래의 근사화된 마스크 사용.
적분 영상을 통한 덧셈 연산 최소화
추가적으로 SURF는 D_yy를 빠르게 계산할수 있도록 적분 영상 integral image 사용
D_yy를 구하기 위해 일반 영상을 사용하는 경우 a_1을 구하는데만 14번 덧셈을 수행해야 함.
적분 영상의 경우 a_1 뿐만 아니라 블록의 크기와 무관하게 세 번의 덧셈 만으로 블록 함 계산 가능.
다중 영상 취득을 위한 다중 스케일 연산자 활용
SIFT에서는 단일 스케일 연산자로 다중 스케일 영상을 획득하였었음.
SURF는 단일 스케일 영상에 그러니까 원본 영상에 다중 스케일 연산자 사용하여 옥타브 1개를 만듬.
옥타브 0의 경우 : 9 x 9, 15 x 15, 21 x 21, 27 x 27 크기의 연산자 사용.
'인공지능' 카테고리의 다른 글
컴퓨터 비전 & 패턴 인식 - 22. 그래프 기반 영상 분할 (0) | 2020.12.14 |
---|---|
컴퓨터 비전 & 패턴 인식 - 21. 영상 분할 기본 (0) | 2020.12.14 |
컴퓨터 비전 & 패턴 인식 - 19. SIFT (0) | 2020.12.14 |
컴퓨터 비전 & 패턴 인식 - 18. 정규 라플라시안 영상을 이용한 스케일 극점 탐색 (0) | 2020.12.14 |
컴퓨터 비전 & 패턴 인식 - 17. 다중 스케일 영상 (0) | 2020.12.14 |