표본 분포 sample distribution
- 통계량에 대한 확률 분포
- 모집단을 알기 위해 모집단으로부터 샘플, 표본을 추출하여 모집단의 모수를 추정한다.
- 통계량은 표본에 대한 함수로 표본 평균과 표본 분산 등
- 표본 평균과 모집단이 정규분포를 따를때 표본 평균의 통계량
- 표본 분산과 표본 분산의 통계량
중심극한정리
- 표본 평균 bar x의 분포는 표본이 많을떄, 모집단의 분포와 상관없이 정규 분포를 따름.
점추정
- 표본으로부터 모수를 추정하는 과정
- 추정자/추정량 estimator : 표본으로부터 모수 추정을 위한 함수 -> 표본 평균, 표본 부난 등
- 추정치 estiamte : 추정자로 구한 통계량 값
- 점 추정 방법으로 적률 추정법과 가능도 함수를 이용한 방법 등이 존재.
구간 추정
- 점추정과 표본으로부터 모수를 추정하는 방법이나 추정한 모수에 대해 신뢰할수 있는 구간도 같이 구하는 방법
- 일반적으로 유의 기준 alpha = 0.05로 설정하여 95% 확률로 신뢰구간이 모수를 포함하도록 구간을 구함.
모평균 구간 추정
- 표본으로 추정한 모평균이 신뢰 구간에 100(1-alpha)%에 들어갈 확률은 다음과 같이 얻는다.
-> 아래는 표본이 충분히 크고, 모분산을 아는경우,
* 표본이 작은 경우는 t분포를 이용하여, 모분산을 모르는 경우 표본 분산을 이용하여 구한다.
모평균 구간 추정
- 학생 30명을 뽑아 성정 평균이 80, 분산이 8인경우 성적 평균의 95% 신뢰 수준의 신뢰 구간을 구해보자
모분산 구간추정
- 모분산 sigma2에 대한 구간 추정을 위해, 자유도가 n - 1인 카이제곱 분포를 이용
두 모집단의 평균차이에 대한 신뢰 구간 구하기
- 표본이 크고 모집단 표준편차를 아는 경우/표본이 작고 모집단 표준편차를 모르는경우/표본이 같고 모집단 표준편차가같은경우
- 위 세가지 경우로 나누어서 구할 수 있다.
1. 표본이 크고, 모집단의 표준편차를 아는 경우 평균 차이에 대한 신뢰구간 구하기
2. 표본이 작고, 모집단의 표준 편차를 모르는 경우 평균 차이에 대한 신뢰구간 구하기
3. 표본이 작고, 표준 편차가 같아 공통 분산 pooled variance S_sigma_p를 갖는 경우
표본의 최소 크기
- 유의 수준 alpha에서 정확도 d를 보장하는 표본의 최소 크기는 아래의 공식으로 구할 수 있다.
추정량 결정하기
- 추정량 : 추정자 estimator를 통해 얻은 모수의 추정값
- 좋은 추정량 estimates를 구하기 위해 다음의 세가지 기준들이 있음.
- 불편성(불편향성) : 추정량의 기대치가 모수에 가까워야 한다.
- 효율성 : 추정량의 분산이 작아야 한다.
- 일치성 : 표본이 커질수록 추정량이 모수에 가까워져야 한다.
'컴퓨터과학 > SW, DB' 카테고리의 다른 글
빅데이터 - 16. 시계열 분석 timeseries analysis (0) | 2020.11.27 |
---|---|
빅데이터 - 15. 가설 검정 (0) | 2020.11.26 |
빅데이터 - 13. 확률 개요와 확률 분포들 (0) | 2020.11.26 |
빅데이터 - 12. 상관 분석과 거리, 다중공선성 (0) | 2020.11.25 |
빅데이터 - 11. 표본 추출 (0) | 2020.11.25 |