728x90
dplyr
- 데이터 매니퓰레이션 단계(전처리)
- select() 변수선택
- filter() 행선택
- arrange() 정렬
- mutate() 새변수 생성
- group by & summarise() 통계량 생성
- pipe, count, sample etc..
select(dataframe, 변수명)
- 변수에 해당하는 행 데이터
starts_width(), ends_width(), contains()
- 변수 찾기
filter(dataframe, 비교문)
- 행 데이터 추출
- ex : filter(data_txt, age > 30)
-
arrange(dataframe, variable)
- 해당 변수 데이터 정렬
- 내림차순시 desc(변수명)
mutate
- 변수(열) 생성
- mutate(dataframe, variable name = function)
summarise()
- 통계값 산출
- summarise(dataframe, 변수명=통계함수, ...)
% (pipe 파이프)
- %>% : 흐름
- 파이프를 이용하여, 파이프 흐름을 따라 데이터프레임을 가공할 수 있다.
- %>%를 사용하지 않는 경우
=> 따로 변수 할당해서 여려줄 반복해서 만들어주어야 한다.
300x250
'수학 > 통계' 카테고리의 다른 글
데이터분석 - 6. R 시각화 (0) | 2020.10.20 |
---|---|
데이터분석 - 5. 확률기초 (0) | 2020.10.19 |
데이터분석 - 4. R그래프들 (0) | 2020.10.19 |
데이터분석 - 2.R 기초 (0) | 2020.10.19 |
데이터분석 - 1.개요 (0) | 2020.10.19 |