확률 밀도 함수 모델링
- 어느 데이터 분포가 존재할때, 평균과 공분산 파라미터로 이루어진 단일 가우시안 확률 밀도함수로 모델링 가능
- 여러개의 가우시안 언덕들로도 모델링 가능 => GMM 혼합 가우시안 모델
- 아래는 단일 가우시안 확률 밀도 함수와 혼합 가우시안 확률 밀도 함수의 비교
- 혼합 가우시안 확률 밀도 함수의 데이터 분포
통계학과 확률 밀도함수 추정
- 통계학적 기법으로 샘플 데이터들로부터 그들을 가장 잘 표현하는 평균, 분산 파라미터를 추정 가능
=> 데이터가 2차원(2변수)의 경우 3차원 공간상에서 만들어짐
우도비 검증 LRT : Likelihood Test 개요
- 남자와 여자에 대한 데이터로 이루어진 2변수 샘플 데이터가 존재한다고할때 각 변수에 대한 가우시안 확률 밀도 함수는 아래와 같이 표기할수 있다.
- 두 확률 밀도 함수로 3차원 공간상이 만들어지고, 이 공간 상 한 점이 여자보다 남자 언덕에서 더 위에 위치한다면
=> 이 샘플 데이터는 여자보다 남자일 가능성이 크다
* 아래의 경우 점 a는 여성일 확률이 p(f) = 0.15, 남성일 확률은 p(m) = 0.5로 남성일 확률이 크다.
우도비 검증 정리
- 특징 벡터 x가 주어질때, x가 속한 클래스 omega_i를 결정하자.
클래스가 2개인 문제에서 우도비 검증
- 사후확률이 더 큰 쪽의 클래스를 선정
- 다듬으면
- 베이즈 정리를 사용하면
- 정규자 p(x)를 제거하고, 우도비(liklihood ratio)에 대해서 결정 규칙 정리
=> 우도비 검증 LRT Likelihood Ratio Test
우도비 검증 결정 규칙 유도 예제 1
- 아래와 같이 두 클래스를 알때, 특징 벡터 x에 대한 아래의 우도비 함수가 주어진다.
=> 우도비 검증 결정 규칙을 찾자 (조건 : 사전 확률은 같음)
1. LRT 식에 우도와 사전확률 대입하고 정리
2. 부호 바꾸고 자연 로그 취하자
4. 정리하면, x가 7보다 크면 omega_1에 속하고, 작으면 omega_2에 속한다
5. 그림으로 그리면
우도비 검증 결정 규칙 유도 예제 2
- 위와 우도가 같으나, 사전 확률이 5P(omega_1) = P(omega_2)일때 LRT 결정 규칙은?
=> 조금 오른쪽으로 이동했다.
-
'수학 > 공업수학, 확률' 카테고리의 다른 글
통계 - 11. 베이즈 위험 (0) | 2020.08.04 |
---|---|
통계 - 10. 오류 확률 (0) | 2020.08.04 |
통계 - 8. 가우시안 분포 매트랩 실습 (0) | 2020.08.03 |
통계 - 7. 다양한 가우시안 공분산 타입 (0) | 2020.08.03 |
통계 - 6. 가우시안 분포들 (0) | 2020.08.03 |