통계량 추정
- 점 추정 : 모수에 대한 추정
- 구간 추정 : 모수에 대한 추정과 모수를 포함하고 있을것이라 신뢰 할수 있는 범위에 대한 추정
신뢰 구간 추정
- 표본수가 많은 경우와 표본수가 적은 경우로 구분해서 볼수 있음.
- 모평균 mu에 대하여 100(1- alpha) % 신뢰구간 추정은 아래와 같이 할수 있다.
1. 표본 수가 많은 경우
- 모집단이 정규분포를 따르고 모분산을 알때
- 모집단이 정규분포를 따르지 않으나 모분산을 알때,
-> 표본이 많으므로 중심극한정리에 따라 정규분포를 따름.
2. 표본이 적은 경우
- 표본 평균 bar_x에 대한 구간 추정
- 표본 분포가 적을때, 표본 평균을 표준화하면 t분포를 따르게 됨.
평균 검정
- 평균과 관련한 귀무가설과 대립가설이 주어질때, 귀무가설의 기각 채택여부를 다루는 검정
=> t검정이라고도 부름, 검정 통계량을 구하여, 기각역에 부합하는지 다룸
- 단일 표본에서의 모평균에 대한 검정 -> ex. 체온의 평균에 대한 가설이 주어질때 주장할수 있는지.
- 두 독립 표본에 대한 평균 검정 -> ex. 두 약성분의 효과에 차이가 존재하는지 비교.
- 대응된 표본에서의 평균 검정 -> ex. 앞다리 평균, 뒷다리 평균에 차이가 존재한다라는 가설
단일 표본 평균 검정의 예시
1. 표본이 큰경우 : 기각역은 표준정규분포를 따르며, 검정 통계량 z0를 사용.
- 다음의 귀무 가설과 대립 가설, 그리고 49개 표본으로 부터 표본 평균이 주어질때
- 위 통계량으로 구한 검정 통계량
- 유의수준 5%에서 기각역
- 검정 통계량이 기각역을 초과하므로 귀무가설 H0에 대한 검정통계량이 기각역에 포함되므로
귀무가설은 기각.
2. 표본이 작은 경우 : 기각역은 t분포를 따르며, 검정통계량 t0를 사용.
- 다음의 귀무가설과 대립가설, 그리고 9개의 표본으로 구한 통계량이 주어질때
- 검정통계량 t0는 다음과 같다.
- 유의 수준 alpha = 0.05에서 기각역은 다음과 같다.
=> 검정 통계량 t0는 기각역에 포함되므로 본 귀무가설은 기각된다.
'
두 표본이 주어질때 차이에 대한 평균 검정(두 집단의 표본 평균이 같은가)
- 두 표본의 차에 대한 표준화된 분포는 아래와 같다.
* Sp는 공통 표준 편차
- 다음의 귀무가설과 대립가설, 그리고 통계량들이 주어질때,
- 표본이 많은 경우 검정 통계량 z0
- 유의 수준 alpha = 0.05에서 기각역
=> 검정 통계량이 기각역에 속하므로 본 귀무가설은 기각한다.
=> 두 집단의 표본 평균에는 유의미한 차이가 존재한다.
'컴퓨터과학 > SW, DB' 카테고리의 다른 글
빅데이터 - 11. 표본 추출 (0) | 2020.11.25 |
---|---|
빅데이터 - 10. 데이터 분석 방법들 (0) | 2020.11.25 |
빅데이터 - 8. 통계학과 기초통계량 (0) | 2020.11.25 |
데이터마이닝 - 4. 앙상블 모델 (0) | 2020.11.25 |
데이터마이닝 - 3. 트리 모델 (0) | 2020.11.25 |