728x90

자료 분석의 주요 관심사

- 두 변수 사이의 관련성

 * ex. 광고비와 순익의 연관성

 

 

결합 분포 joint distribution

- 2개 이상의 확률 변수들을 같이 고려한 확률 분포

 * ex. 키에 대한 확률 변수 X와 몸무게에 대한 확률 변수 Y => 키가 180cm 이상이고, 몸무게가 80kg 이상일 확률

 

 

다변량 확률 분포 multivariate distriubiton

- 여러 확률 변수들의 결합분포

 

이변량 확률 분포 bivariate distribution

- 두 확률 변수의 결합 분포

 

 

 

 

 

 

 

결합 확률 분포의 기대값, 공분산, 상관계수

1. 기댓값 expectation

- 이산/연속 확률 변수가 주어질때 결합확률질량/밀도 함수에 대한 기댓값은 아래와 같다.

 

2. 공분산 covariance

- 두 변수간의 관계를 나타내는값

 

 

3. 상관 관계 correlation

- 공분산은 각 확률 변수의 단위에 의해 정해짐

 => 각 변수의 표준편차를 나누어 표준화한 상관계수(rho)로 상관관계를 알 수있음

- 아래는 상관 계수의 식

 

 

 

 

 

 

조건부 확률 분포 conditional probabilistic distribution

- 조건부 분포 : 두 확률 변수 (X, Y) 중 Y의 값이 주어질때 X의 확률 분포

 * ex. X는 키, Y는 몸무게라고 할때, 몸무게가 80인 경우 키에 대한 확률 분포

- 두 확률 변수 X, Y가 주어질때 조건부 확률 분포는 다음과 같이 정의 가능

 

 

 

이변량 정규분포 bivariate normal distribution

- 정규분포를 2개의 변수에 대해 결합 분포로 확장한 것

 * ex. 키와 몸무게에 대한 확률 변수를 이변량 정규분포로 표현 가능

- 다음의 경우 두 확률 변수 X1과 X2에 대한 이변량 정규분포를 정리함

 

 

다변량 정규분포 multivariate normal distribution

- 이변량 정규분포와 마찬가지로 벡터와 행렬로 간편하게 표현 가능함

- p개의 확률 변수 X1, ..., Xp가 다변량 정규분포를 따르는경우 X1, .., Xp의 결합 확률 밀도함수는 다음과같음

 * 행렬식 determinant : 행렬의 역행렬이 존재하는지 판별하는 식

 

- 확률 변수 X가 다변량 정규분포를 따를때 다음과 같이 정리할 수 있다.

 

 

300x250

'수학 > 공업수학, 확률' 카테고리의 다른 글

확률 - 9. 확률 과정  (0) 2020.08.13
확률 - 8. 표본 분포  (0) 2020.08.12
확률 - 6. 연속 확률 분포  (0) 2020.08.12
확률 - 5. 이산 확률 분포  (0) 2020.08.12
확률 - 4. 확률 분포  (0) 2020.08.11

+ Recent posts