자료 분석의 주요 관심사
- 두 변수 사이의 관련성
* ex. 광고비와 순익의 연관성
결합 분포 joint distribution
- 2개 이상의 확률 변수들을 같이 고려한 확률 분포
* ex. 키에 대한 확률 변수 X와 몸무게에 대한 확률 변수 Y => 키가 180cm 이상이고, 몸무게가 80kg 이상일 확률
다변량 확률 분포 multivariate distriubiton
- 여러 확률 변수들의 결합분포
이변량 확률 분포 bivariate distribution
- 두 확률 변수의 결합 분포
결합 확률 분포의 기대값, 공분산, 상관계수
1. 기댓값 expectation
- 이산/연속 확률 변수가 주어질때 결합확률질량/밀도 함수에 대한 기댓값은 아래와 같다.
2. 공분산 covariance
- 두 변수간의 관계를 나타내는값
3. 상관 관계 correlation
- 공분산은 각 확률 변수의 단위에 의해 정해짐
=> 각 변수의 표준편차를 나누어 표준화한 상관계수(rho)로 상관관계를 알 수있음
- 아래는 상관 계수의 식
조건부 확률 분포 conditional probabilistic distribution
- 조건부 분포 : 두 확률 변수 (X, Y) 중 Y의 값이 주어질때 X의 확률 분포
* ex. X는 키, Y는 몸무게라고 할때, 몸무게가 80인 경우 키에 대한 확률 분포
- 두 확률 변수 X, Y가 주어질때 조건부 확률 분포는 다음과 같이 정의 가능
이변량 정규분포 bivariate normal distribution
- 정규분포를 2개의 변수에 대해 결합 분포로 확장한 것
* ex. 키와 몸무게에 대한 확률 변수를 이변량 정규분포로 표현 가능
- 다음의 경우 두 확률 변수 X1과 X2에 대한 이변량 정규분포를 정리함
다변량 정규분포 multivariate normal distribution
- 이변량 정규분포와 마찬가지로 벡터와 행렬로 간편하게 표현 가능함
- p개의 확률 변수 X1, ..., Xp가 다변량 정규분포를 따르는경우 X1, .., Xp의 결합 확률 밀도함수는 다음과같음
* 행렬식 determinant : 행렬의 역행렬이 존재하는지 판별하는 식
- 확률 변수 X가 다변량 정규분포를 따를때 다음과 같이 정리할 수 있다.
'수학 > 공업수학, 확률' 카테고리의 다른 글
확률 - 9. 확률 과정 (0) | 2020.08.13 |
---|---|
확률 - 8. 표본 분포 (0) | 2020.08.12 |
확률 - 6. 연속 확률 분포 (0) | 2020.08.12 |
확률 - 5. 이산 확률 분포 (0) | 2020.08.12 |
확률 - 4. 확률 분포 (0) | 2020.08.11 |