728x90

3.4 정보 필터 the information filter

 칼만필터의 쌍둥이로 정보 필터가 있습니다. 이는 칼만필터와 그의 비선형 버전인 EKF 처럼 정보필터 IF는 가우시안으로 신뢰도를 나타냅니다. 그래서 표준 정보필터는 칼만필터와 동일한 가정을 따르게 됩니다. 칼만 피렅와 정보 필터사이의 큰 차이는 가우시안 신뢰도가 표현되는 방법인데, 칼만 필터 알고리즘 군에서는 가우시안이 모멘트(평균, 공분산)으로 표현되는 반면에, 정보 필터는 가우시안을 표준 표현법인 정보 행렬과 정보 백터로 표현합니다. 이 표현법의 차이는 다른 갱신 방정식을 만드는데, 하나의 표현법이 계산상으로 복잡하다면 다른것은 단순하다고 할수있습니다. 표준 표현법과 모멘트 표현법은 서로 서로의 쌍둥이라고 하며 그래서 IF와 KF가 됩니다.

 

3.4.1 표준 표현법 canonical representation

 다변수 가우시안의 표준 표현법은 행렬 $\Omega$와 행렬 $\xi$로 나타낼수 있습니다. 행렬 $\Omega$는 역 공분산 행렬로 아래와 같으며 $\Omega$는 정보 행렬 information matrix나 정밀 행렬 precision matrix라 불립니다.

 

 벡터 $\xi$는 정보 벡터 information vector로 다음과 같이 정의됩니다.

 

 $\Omega$와 $\xi$는 가우시안의 파라미터로 볼수 있습니다. 특히 가우시안의 평균과 공분산은 표준 표현법 (3.65)와 (3.66)의 역으로 쉽게 얻을수 있습니다.

 

 

 표준 표현법은 가우시안의 지수를 곱하여 구할수 있는데, 일단 식 (3.1)에서 다변수 정규 분포를 다음과 같이 정의하였습니다.

 

 다음의 직관적인 변환으로 아래의 파라미터화를 할수 있고,

 여기서 "const"라고 라밸한 항은 목표 변수 x에 의존하지 않으므로 이를 정규자 $\eta$에 포함시키겠습니다.

 

 이형태는 정규 파라미터 $\Omega$와 $\xi$으로 가우시안을 파라미터화 시키게 됩니다.

 

 많은 경우 표준 표현법이 모멘트 표현법보다 더 명쾌한데, 가우시안의 부정 로가리즘은 표준 파라미터 $\Omega$와 $\xi$에 대한 이차 함수가 됩니다. 여기서 "const"는 상수 입니다.

 

 여기서 왜 이 상수를 $\eta$로 표기하지 않는지 궁금할수 있는데 확률의 부정 로가리즘은 1로 정규화 할수 없기 때문입니다. 확률 분포 p(x)의 부정 로가리즘은 x에서 이차적이며 이차 항은 $\Omega$로, 선형 항은 $\xi$로 나타냅니다. 가우시안에서 $\Omega$는 양의 준정부호 positive semidefinite여야만 하는데, 그래서 - log p(x)는 평균 $\mu$ = $\Omega^-1$ $\xi$인 이차 거리함수가 됩니다. 이는 식 3.73의 일차 미분을 0으로 할때 쉽게 구할수있습니다.

 

 행렬 $\Omega$는 다른차원의 변수 x에서 거리 함수가 증가시키는 비율을 결정합니다. 이 행렬 $\Omega$로 가중되는 이차 거리를 마할라 노비스 거리라고 부릅니다.

 

 

3.4.2 정보 필터 알고리즘

 

표 3.4 정보 필터 IF 알고리즘

 

 표 3.4는 정보 필터라는 갱신 알고리즘을 보여주고 있습니다. 여기서 입력은 표준 표현법의 가우시안인 $\xi_{}t-1$과 $\Omega_{t-1}$로 시간이 t-1일때 신뢰도를 나타내는 값이 됩니다. 베이지안 필터에서 입력을 제어 $u_t$, 측정 $z_t$로 한것과 동일합니다. 출력은 갱신되는 가우시안의 파라미터인 $\xi_t$와 $\Omega_t$가 됩니다.

 

 갱신과정에서 행렬 $A_t$, $B_t$, $C_t$, $R_t$, $Q_t$를 포함하는데, 이들은 3.2장에서 정의하였었습니다. 정보 필터는 상태 전이와 측정 핼렬은 다음의 선형 가우시안 가정을 따르며, 식 (3.2)와 (3.5)에서 정의하였었습니다.

 

 여기서 $R_t$, $Q_t$는 0평균 노이즈 변수 $\varepsilon$, $\delta$의 공분산이 됩니다.

 

 칼만피렅와 마찬가지로 정보 행렬은 두 단계로 갱신이 수행되며, 예측 단계와 측정 갱신 단계로 이루어집니다. 예측 단계는 2, 3번째 줄에서 구현되었으며 여기서 파라미터 $\bar{\xi_{t}}$, $\bar_{\Omega_{t}}$는 제어 $u_t$를 반영한 후, 관측 $z_t$를 반영하기 전인 $x_t$에 대한 가우시안 신뢰도를 의미합니다. 후자는 4,5줄에서 수행되며 이 신뢰도는 관측 $z_t$에 딸 ㅏ갱신되어 집니다.

 

 여기서 두 갱신 단계는 상태 공간이 많은 차원을 다룬다면 복잡도가 달라질수 있습니다. 표 3.4의 예측 과정에서 크기가 n x n인 행렬의 역을 포함하고 있어 이 역행렬은 O($n^{2.8}$)시간을 요구하게 됩니다. 칼만필터에서 갱신 시간은 더 들어서 O($n^2$)이 필요하였으며, 일부 변수만 제어의 영향을 받는다면 더 적은 시간이 소요되게 합니다. 이 역활은 갱신단계에서는 뒤집어 지는데 관측 갱신에서 정보 필터가 추가적인 시간이 필요하게 되어 O($n^2$) 시간을 소모하게 되어 상태 변수의 일부 정보만 관측이 전달하는 경우 더 효울적으로 됩니다. 관측 갱신은 칼만 필터에서 더어렵게 수행됩니다.

300x250

+ Recent posts