728x90

SIFT 개요

 

이동, 회전, 스케일 불변한 대표적인 특징 검출 알고리즘으로

 

SIFT Scale-Invariant Feature Tranform(Lowe99)

 

SIFT 역시 스케일 공간을 다루면서, 피라미드 구조로 됨.

 

피라미드로 원본 영상이 4 x 4가 될때까지 줄임

 

한 층은 스케일 공간 상 6개의 영상으로 구성(옥타브)

 

원본 크기의 영상들을 옥타브 0, 다음은 옥타브 1, ...

 

 

sigma_1 = 1.6

옥타브 2 - sigma_2 = k * sigma_1

...

옥타브 i+1 - sigma_i+1 = k * sigma_i의 규칙을 따름

 

 

이미지 피라미드

 

 

 

 

 

 

 

한 옥타브에서 6개 영상 구하는 방법

 

i번째 영상은 sigma_i로 스무딩이 되어있음

 

i + 1번쨰 영상은

 

원본 영상을 sigma_i+1로 스무딩 = i 번째 영상을 sigma_i+1와  sigma_i의 차이(sigma 제곱 차 루트)로 스무딩

 

 

 

 

 

 

나머지 옥타브 영상 구하는 방법

 

1. 이전 옥타브의 네 번째 영상을 다운 샘플링하여 새 옥타브의 첫번째 영상으로 사용.

 

2. 위 sigma 차이를 이용한 방법으로 옥타브의 나머지 5개 영상 획득

 

3. 영상의 크기가 4 x 4인 옥타브가 만들어질떄까지 1, 2반복

 

 

 

 

 

 

SIFT 키포인트 검출하기

 

계산량을 줄이기 위해 해리스 라플라스 방법에서 보았던 정규 라플라시안을 사용하기 보다는

 

정규 라플라시안과 유사한 결과를 얻을수 있는 DOG(Difference of Gaussian)를 사용.

 

DOG는 가우시안 스무딩된 영상의 차로 구할 수 있음.

 

 

기존의 가우시안 영상 간의 차 연산으로 DOG 피라미드를 구함.

 

 

 

 

DOG 피라미드 상에서 이웃한 26개 점 사이에 자신이 극점인 경우 특징점이라 부르고

 

이 특징점이 임계치를 넘긴다면 키포인트 keypoint라 부름

 

위 과정을 통해 구한 특징점은 y, x, o, i 정보를 가짐. (o : 옥타브 번호, i : dog 번호)

 

이제 옥타브 0영상으로 변환해야하고, o와 i에 대한 정보가 스케일값 s로 변환해야 하므로 아래와 같이 구할 수 있음.

 

 

 

 

 

300x250

+ Recent posts