728x90

값 라벨 바꾸기

- 숫자로 입력된 값을 라벨로 바꾸기

ex. job 1-> 근로자, 2 -> 사무직 3-> 전문가

 

명목형 변수 nomial data로 바꾸기 : factor()함수

 

 

 

순서형 변수 ordered data 로 바꾸기

- ordered()함수

 

 

 

막대 그래프 그리기

 

1. table()함수 : 해당 변수 - 빈도수 출력

2. barplot() : 막대 그래프 출력

3. title() : 그래프 제목

 

 

 

 

 

변수 변환하기 recode

- 그룹별 값주기

 

 

 

 

 

 

변수값 변환하기 recode - car 패키지의 recode() 활용하기

 

 

 

- 레코드 후, 순서형 변수로 라벨을 주어야 그룹의 의미를 알기 편하다.

 

 

 

 

 

값 추출하기

 

 

 

 

dplyr 패키지

- 데이터 처리를 위한 패키지

- 전처리 작업

 1. filtering 데이터 추출

 2. selection columns 변수 선택

 3. adding new variables 변수 추가

 4. sorting 정렬

 5. aggregating 집계

 

 

 

 

 

실무에서 처음 할일

- 변수의 수나 obs가 크므로 분석 전에 전체적으로 보는 것이 좋다

- dim() 함수 : obs 행 와 변수 갯수(열)수 출력

- tbl_df() : 데이터 프레임을 요약해서 출력

 

 

 

 

데이터 추출 filtering

 

 

 

 

 

변수 선택 select

 

 

 

 

 

- filter와 select 동시 사용 가능

-select 로 변수 선택시 콜론 : 사용 가능

 

 

 

 

새 변수 추가 mutate() 함수

- mutate(데이터프레임, 추가할변수명=값)

 

 

정렬하기

- arrange(데이터프레임, 변수, ...) : 오름차순

- arrange(데이터프레임, desc(변수), ...) : 내림차순

 

 

 

 

요약해서 결과보기

- 데이터 정렬한 뒤, 그룹별 요약 결과 보기 : group_by(), summarise() 함수

 

 

체인 기능

- 여려 명령을 연결해서 사용

- %>%으로 수행

 

 

 

 

mtcar 데이터 처리 예제

 

 

- 필터 -> 그룹 -> 요약 -> 정렬

 

nycflight13 데이터 예제

- 뉴욕인근 공한 비행 정보 자료

- ls(패키지명) : 패키지에 있는 데이터프레임 확인

- tbl_df : 데이터프레임 요약

- 출발, 도착이 지연되지 않은 경우

 

 

 

 

 

 

 

300x250

+ Recent posts