728x90

재귀적인 상태 추정 recursive state esetimation

 

2.1 소개

 확률적 로봇 공학에서의 핵심은 센서 데이터로부터 상태를 추정하는 것입니다. 상태 추정은 센서 데이터를 이용해서 직접 구할수 없으나 추론해 낼수 있는 값이나 양을 추정하는 문제를 다루고 있습니다. 대다수의 로봇 공학 어플리케이션에서 값을 확실히 알수 있다면 상대적으로 쉬울 것입니다. 예를들자면 로봇과 로봇 주위의 장애물의 위치를 알고 있다면 이동 로봇의 동작은 상대적으로 쉬울것입니다.

 

 불행이도 이러한 변수들은 바로 구할수가 없으며, 대신 로봇은 이러한 정보들을 얻기 위해 센서를 이용하여야만 합니다. 센서들은 이 값들에 대해 부분적인 정보만 제공하며 이 측정치들은 노이즈가 더해지게 됩니다. 상태 추정은 이 손상된 데이터로부터 상태 변수를 복원하게 됩니다. 확률적인 상태 추정 알고리즘은 모든 가능한 상태들 중에서 신뢰할수 있는 확률 분포를 계산하며, 확률적인 상태 추정의 예시로 이미 소개 단에서 이동 로봇의 위치 추정 문제를 통해 살펴보았습니다.

 

 이번 장에서의 목표는 센서 데이터로부터 상태 추정에 있어서 기본적인 용어와 수학적인 도구를 소개하여 보겠습니다.

 

- 2.2장에서는 이 책 전반에 사용하는 확률적인 기본 개념과 용어에 대해서 소개하겠습니다.

- 2.3장에서는 전반적으로 다루는 모델을 설명하겠습니다.

- 2.4장에서는 상태 추정을 위해 모든 기술들의 기반이 되는 베이즈 필터와 재귀적인 알고리즘을 소개하겠습니다

- 2.5장에서는 베이즈 필터를 구현시 발생하는 문제들을 다루어 보겠습니다.

 

 

2.2 확률 기본 개념 

 이번 장에서는 기본 용어와 확률적인 개념들을 살펴보겠습니다. 확률적 로봇 공학에서는 센서 측정, 제어, 로봇 상태, 주위 환경 등 같은 값은 확률 변수로 다룰수 있습니다. 확률 변수는 확률 법칙을 따르는 여러 값들로 이루어져 있습니다. 확률 추론은 센서 데이터와 같은 다른 확률 변수들로부터 구할 수 있는 확률 변수를 이러한 법칙에 따라 계산하는 과정이 됩니다.

 

 X를 확률 변수, x을 X에 대한 특정 사건이라고 합시다. 확률 변수의 기본적인 예시로 코인 뒤집기인데, 여기서 X의 사건으로 앞면과 뒷면이 존재합니다. X에 대해 일어날 수 있는 값들이 이산적이라면 확률 변수 X가 x일 때 확률을 아래와 같이 나타낼 수 있습니다.

 

 

 예를 들어 동전은 p(X=앞면) = p(X = 뒷면) = 1/2처럼 정리 할수 있으며, 이 이산 확률의 합은 아래와 같습니다.

 

 

추가적으로 확률은 항상 음수가 아니므로 p(X = x) >= 0이 됩니다. 이를 단순히 나타내기 위해 가능한 확률 변수의 표기를 생략하기도 하는데 p(X = x) 대신 p(x)로 주로 쓰입니다.

 

 이 책에서 설명하는 대부분의 기술들은 연속 공간에서의 추정과 결정 문제를 다르며, 연속 공간은 연속적인 값을 가지는 확률변수로 나타낼 수 있습니다. 이 책 전체에서 확률 밀도 함수 (PDF probability density functions)를 가지는 연속 확률 변수를 사용하겠습니다. 가장 흔한 확률 밀도 함수로 1차원 정규 분포 normal distribution로 평균 $\mu$와 분포 $\sigma^2$로 이루어져 있습니다.

 

 이 분포는 아래의 가우시안 함수로 나타낼 수 있습니다.

 

 

 정규 분포는 이 책에서 큰 역활을 할것이며 이를 N(x; $\mu$, $\sigma^2$)로 특정 확률 변수와 그 변수의 평균, 분산을 표현하겠습니다.

 

 (2.3)의 정규 분포에서 x는 스칼라 값을 의미하며 x가 다차원 벡터가 될수도 있습니다 이 경우 벡터에 대한 정규 분포를 다변수 multivarate라 하며 다변수 정규 분포는 아래의 확률 밀토 함수로 나타낼 수 있습니다.

 

 

 위 식에서 $\mu$는 평균 벡터이고 $\Sigma$는 공분산이라 부르는 대칭 행렬이 됩니다. 첨자 $ ^{T}$는 벡터의 전치를 나타내며, 식 (2.4)가 식 2(.3)을 일반화 한것임을 알 수 있습니다. 1, 2차원 정규분포의 확률 밀도 함수는 그림 5.6에서 보여주고 있습니다.

 

 식 (2.3), (2.4)은 확률 밀도함수의 예시로 이산 확률 분포의 합이 1이 되듯이 PDF도 항상 적분하면 1이 됩니다.

 

 이 책에서는 확률, 확률 밀도, 확률 밀도함수라는 개념을 계속 사용할 것이며 모든 연속 확률 변수들이 측정 가능하고, 모든 연속 확률 분포들이 밀도를 가지고 있다고 가정하겠습니다.

 

 두 확률 변수 X, Y의 결합 분포 joint distribution은 다음과 같습니다.

 

 

 이 표현법은 확률 변수 X의 값이 x이고 Y의 값이 y일때 사건의 확률을 나타내며, X와 Y가 독립이라면 다음과 같이 나타낼 수 있습니다.

 

 

 종종 확률 변수들은 다른 확률 변수들에 대한 정보도 같이 제공하는 경우도 있습니다. Y의 값인 y를 이미 알고있다고 햇을때 X의 값인 x의 확률을 다음과 같이 나타낼 수 있으며 이를 조건부 확률이라 합니다.

 

 

 만약 p(y) > 0 이면 조건부 확률은 다음과 같이 정의 할 수 있습니다.

 

 

 X, Y가 독립인 경우 아래와 같습니다.

 

 

 

 다르게 설명하면 X, Y가 독립이라면 Y는 X의 값을 구하는데 영향을 주지 않는다고 할 수 있습니다. 이 경우 우리가 X을 알아야 할때 Y를 안다고 아무런 도움이 되지 않습니다. 독립과 조건부 독립은 이 책 전반에서 중요한 역활을 하게 됩니다.

 

 조건부 확률과 확률에 대한 공리로부터 찾을수 있는것으로 전체 확률 정리 theorem of total probability가 있는데, p(x|y)나 p(y)가 0이라면, p(x|y)p(y)는 0이 됩니다.

 

 

 

 다른 중요한 것으로 베이즈 정리가 있는데 조건부 확률 p(x|y)는 역인 p(y|x)와 관련을 가지고 있습니다. 이 정리에 따라 정리하면

 

 베이즈 정리는 호가률적 로봇 공학에서 중요하게 되는데, x가 y로 부터 추론할 값이라면 확률 p(x)는 사전 확률 분포, y는 데이터(센서 측정값)이라 할 수 있습니다. 확률 분포 p(x)는 데이터 y를 합치기 전에 X에 대한 정보를 의미하며, 확률 p(x|y)는 X에 대한 사후 확률 분포라 부릅니다.

 

 식 2.14)와 같이 베이즈 정리는 역 조건부 확률인 p(y|x)와 사전확률 p(x)를 이용해서 사후 확률 p(x|y)을 계산하는 쉬운 방법을 제공하고 있습니다. 우리가 센서 데이터 y를 이용해 값 x를 구해야한다면, 베이즈 정리는 x가 주어질때 데이터 y의 확률을 의미하는 역 확률을 통해 구하도록 하고 있습니다. 로봇 공학에서 이 역 확률 변수를 생성 모델 generative model이라고도 하며, 이는 어떻게 상태 변수 X가 센서 측정 Y에 영향을 주는지를 나타냅니다.

 

 베이즈 정리에서 또 중요한 점은 분자 p(y)로 x에 대해 의존하지 않습니다. 그래서 식 (2.13)과 (2.14)에서 p(y$)^-1$은 사후 확률 p(x|y)에서 어느 x에 대해 똑같습니다. 이런 이유로 p(y$)^-1$는 정규화 변수 $\eta$로 표기하겠습니다.

 

 

확률 변수 X의 기댓값은 다음과 같이 구할 수 있습니다.

 

 

 확률 변수의 선형 함수에 대한 기댓값은 다음과 같으며 여기서 a, b는 일반적인 수치 값을 의미합니다.

 

 

X의 공분산은 다음의 식으로 구할 수 있습니다.

 

 

 공분산은 평균과 재곱의 기댓값의 차이로 구할수 있으며 위에서 살펴보았던 다변수 정규 분포 N(x; $\mu$, $\Sigma$)의 평균은 $\mu$이고 여기서 공분산은 $\Sigma$가 됩니다.

 

 확률 변수의 다른 중요한 특성으로 엔트로피가 있습니다. 이산 확률 변수에서 엔트로피는 다음의 식으로 구할 수 있습니다.

 

 

 엩프로피라는 개념은 정보 이론 information theory에서 나왔는데 엔트로피는 x의 값이 전달하는 정보의 기댓값을 말합니다 : -$log_2$ p(x)는 최적의 인코딩을 통해 x를 인코딩하는데 필요한 비트의 수이며 p(x)는 x를 관측할 확률을 의미합니다. 이 책에서 엔트로피는 로봇이 감지할 때 얻을수 있는 정보를 표현하기 위해 사용합니다.

 

 마지막으로 다른 확률 변수 Z가 있는 조건부 확률을 정리하면 Z=z인 베이즈 정리에 따라 다음과 같이 정리할 수 있습니다.

 

 

변수 z가 식(2.7)처럼 독립 확률변수라면 조건부 정리는 다음과 같이 됩니다.

 

 

이러한 관계를 조건부 독립이라 하며 식 (2.24)는 다음과 같습니다.

 

 

 로봇 공학에서 조건부 독립은 중요한 역활을 하게 됩니다. 다른 변수 z를 알고있으나, y가 변수 x에 대해 아무런 정보를 제공하지 않을때 사용할 수 있습니다. 조건부 독립은 완전한 독립이라고 할 수 없습니다.

 

 

역또한 성립 될수 없습니다.

 

 

300x250

+ Recent posts