기술 통계
- 개별 기술통계
- 그룹별 기술통계
- 기술통계 플로팅(줄기잎, 박스, 히스토그램)
- 분할표 contingency table
데이터 준비
통계량 출력
다변수 접근
다변수 기술통계량 출력
- 데이터프레임.describe()
왜도, 첨도 확인하기
왜도 skewness
- E(((X-mu)/sigma)^3)
- 한방향으로 치우쳐진 정도
- 왼쪽으로 치우쳐지면 positive skewness
- 우측으로 치우쳐지면 negative skewness
첨도 kurtosis
- E(((X-mu)/sigma)^4) - 3
- 분포의 꼬리에 데이터가 몰려있는지에 관한 측도
왜도, 첨도 예제
- skew(a) : 결과 분포가 우측으로 매우 치우쳐짐
- kurtosis(a) : 첨도가 매우 큰걸 볼수있음
- 999가 빠진 경우 첨도
=> 16에서 1로 크게 줄음
그룹별 통계량
1. 성별로 그룹. total 변수, 열에 대한 기술통계량
2. agg()함수 사용하여 기술 통계량 구하기
researchpy
- 그룹별 기술통계량 제공하는 라이브러리
- 설치먼저 해주고
summary_cont 함수
- 바로 total 변수에 대한 통계량
- 성별로 그루핑후 통계량
파이썬 줄기잎 라이브러리(stemgraphic)
-pip로 설치해줍시다.
줄기잎 그림 그리기
stemgraphic.stem_graphic(데이터프레임.변수, scale=스케일크기)
sns 플로팅
1. 단순 박스 플롯
2. 그룹별 box plot
- 범주형 변수인 gender를 x축으로 지정
히스토그램 그리기
1. 단순 히스토그램
2. 성별에 따른 히스토그램
앙케이트 데이터 다루기
1. 데이터 로드
2. 교차 텝 만들기
3. 인덱스명 변경
카이제곱검정
- 사이파이에서 가져옴
카이제곱통계량
p벨류
기회도수 등
'수학 > 통계' 카테고리의 다른 글
파이썬R - 8. 분산 분석 (0) | 2020.10.28 |
---|---|
파이썬R - 7. 평균 검정 (0) | 2020.10.28 |
파이썬R - 5. R 기술통계 (0) | 2020.10.28 |
파이썬R - 4. 파이썬과 R 그래픽 라이브러리 (0) | 2020.10.28 |
파이썬R - 3. R데이터처리, dplyr (0) | 2020.10.28 |