728x90

기술 통계

- 개별 기술통계

- 그룹별 기술통계

- 기술통계 플로팅(줄기잎, 박스, 히스토그램)

- 분할표 contingency table

 

 

 

데이터 준비

 

통계량 출력

 

 

 

다변수 접근

 

다변수 기술통계량 출력

- 데이터프레임.describe()

 

 

 

 

왜도, 첨도 확인하기

왜도 skewness

 - E(((X-mu)/sigma)^3) 

 - 한방향으로 치우쳐진 정도

 - 왼쪽으로 치우쳐지면 positive skewness

 - 우측으로 치우쳐지면 negative skewness

 

 

첨도 kurtosis

 - E(((X-mu)/sigma)^4) - 3

 - 분포의 꼬리에 데이터가 몰려있는지에 관한 측도

 

 

 

왜도, 첨도 예제

- skew(a) : 결과 분포가 우측으로 매우 치우쳐짐

- kurtosis(a) : 첨도가 매우 큰걸 볼수있음  

- 999가 빠진 경우 첨도

 => 16에서 1로 크게 줄음

 

 

 

 

그룹별 통계량

1. 성별로 그룹. total 변수, 열에 대한 기술통계량

 

 

2. agg()함수 사용하여 기술 통계량 구하기

 

 

 

 

 

researchpy

- 그룹별 기술통계량 제공하는 라이브러리

- 설치먼저 해주고

 

 

summary_cont 함수

- 바로 total 변수에 대한 통계량

- 성별로 그루핑후 통계량

 

 

 

 

 

 

파이썬  줄기잎 라이브러리(stemgraphic)

-pip로 설치해줍시다.

 

 

 

줄기잎 그림 그리기

stemgraphic.stem_graphic(데이터프레임.변수, scale=스케일크기)

 

 

 

sns 플로팅

1. 단순 박스 플롯

2. 그룹별 box plot

- 범주형 변수인 gender를 x축으로 지정

 

 

 

 

 

 히스토그램 그리기 

1. 단순 히스토그램

 

2. 성별에 따른 히스토그램

 

 

 

앙케이트 데이터 다루기

1. 데이터 로드

2. 교차 텝 만들기

3. 인덱스명 변경

 

 

 

카이제곱검정

- 사이파이에서 가져옴

 

카이제곱통계량

p벨류

기회도수 등

 

 

 

 

 

 

 

300x250

+ Recent posts