728x90

dplyr

- 데이터 매니퓰레이션 단계(전처리)

- select() 변수선택

- filter() 행선택

- arrange() 정렬

- mutate() 새변수 생성

- group by & summarise() 통계량 생성

- pipe, count, sample etc..

 

 

select(dataframe, 변수명)

- 변수에 해당하는 행 데이터 

 

 

starts_width(), ends_width(), contains()

- 변수 찾기

 

filter(dataframe, 비교문)

- 행 데이터 추출

- ex : filter(data_txt, age > 30)

-

 

arrange(dataframe, variable)

- 해당 변수 데이터 정렬

- 내림차순시 desc(변수명)

 

 

mutate

- 변수(열) 생성

- mutate(dataframe, variable name = function)

 

summarise()

- 통계값 산출

- summarise(dataframe, 변수명=통계함수, ...)

 

 

% (pipe 파이프)

- %>% : 흐름

- 파이프를 이용하여, 파이프 흐름을 따라 데이터프레임을 가공할 수 있다.

 

- %>%를 사용하지 않는 경우

 => 따로 변수 할당해서 여려줄 반복해서 만들어주어야 한다.

300x250

'수학 > 통계' 카테고리의 다른 글

데이터분석 - 6. R 시각화  (0) 2020.10.20
데이터분석 - 5. 확률기초  (0) 2020.10.19
데이터분석 - 4. R그래프들  (0) 2020.10.19
데이터분석 - 2.R 기초  (0) 2020.10.19
데이터분석 - 1.개요  (0) 2020.10.19

+ Recent posts