값 라벨 바꾸기
- 숫자로 입력된 값을 라벨로 바꾸기
ex. job 1-> 근로자, 2 -> 사무직 3-> 전문가
명목형 변수 nomial data로 바꾸기 : factor()함수
순서형 변수 ordered data 로 바꾸기
- ordered()함수
막대 그래프 그리기
1. table()함수 : 해당 변수 - 빈도수 출력
2. barplot() : 막대 그래프 출력
3. title() : 그래프 제목
변수 변환하기 recode
- 그룹별 값주기
변수값 변환하기 recode - car 패키지의 recode() 활용하기
- 레코드 후, 순서형 변수로 라벨을 주어야 그룹의 의미를 알기 편하다.
값 추출하기
dplyr 패키지
- 데이터 처리를 위한 패키지
- 전처리 작업
1. filtering 데이터 추출
2. selection columns 변수 선택
3. adding new variables 변수 추가
4. sorting 정렬
5. aggregating 집계
실무에서 처음 할일
- 변수의 수나 obs가 크므로 분석 전에 전체적으로 보는 것이 좋다
- dim() 함수 : obs 행 와 변수 갯수(열)수 출력
- tbl_df() : 데이터 프레임을 요약해서 출력
데이터 추출 filtering
변수 선택 select
- filter와 select 동시 사용 가능
-select 로 변수 선택시 콜론 : 사용 가능
새 변수 추가 mutate() 함수
- mutate(데이터프레임, 추가할변수명=값)
정렬하기
- arrange(데이터프레임, 변수, ...) : 오름차순
- arrange(데이터프레임, desc(변수), ...) : 내림차순
요약해서 결과보기
- 데이터 정렬한 뒤, 그룹별 요약 결과 보기 : group_by(), summarise() 함수
체인 기능
- 여려 명령을 연결해서 사용
- %>%으로 수행
mtcar 데이터 처리 예제
- 필터 -> 그룹 -> 요약 -> 정렬
nycflight13 데이터 예제
- 뉴욕인근 공한 비행 정보 자료
- ls(패키지명) : 패키지에 있는 데이터프레임 확인
- tbl_df : 데이터프레임 요약
- 출발, 도착이 지연되지 않은 경우
'수학 > 통계' 카테고리의 다른 글
파이썬R - 5. R 기술통계 (0) | 2020.10.28 |
---|---|
파이썬R - 4. 파이썬과 R 그래픽 라이브러리 (0) | 2020.10.28 |
파이썬R - 2. R 데이터처리 (0) | 2020.10.27 |
파이썬R - 1. 파이썬 pandas (0) | 2020.10.27 |
통계 - 16. 실험계획법과 검정 (0) | 2020.10.27 |