728x90

목표

- 머신/딥러닝 기본 이론

- 데이터 취득, 분석

- matplotlib, seaborn 시각화 까지

* 숫자가 아닌 필드를 숫자로 바꾸어주자!!

 

 

 

 

빠트린거

- 볼륨 설정을 하는데 자꾸 permission denied 발생

 

 

 

 

도커 이미지 내의 

 

jovyan 폴더를 권한 777주는게 아니라

 

치프트키 님의 글을 보니 호스트 볼륨 폴더에 권한을 주어야되더라

 

chiftkey.tistory.com/3

 

 

일단 이 문재는 해결했고..

 

 

 

 

 

 

구글 클라우드 플랫폼에서 방화벽 포트도 열어주고

 

도커 런시 포트도 연결 시켜주었으나 페이지에 접속하지 못하고 있다

 

 

* 방화벽도 설정하고, jupyter 외부접속도 허용도하고

포트 포워딩도 다 했는데 왜안되나 했는더니

 

방화벽 규칙 대상을 

 

네트워크의 모든 인스턴스 적용을 안해놔서 그렇더라 

 

80 포트는 잘되는데 내가 만든 8888포트 허용 규칙이 왜안되나 했다

 

 

 

 

 

 

 

 

 docker run -p 8888:8888 --memory=2g -v ~/gitlab/ssac-pytorch-1st/exercise:/ds --name hello /jaimeps/rl-gym

 

 

 

sklearn dataset

- 아래 링크서 많이 제공

scikit-learn.org/stable/datasets/index.html

 

 

 

sklearn dataset 호출시

- load : simple data

- fetch : real world data

 

 

 

 

 

 

df.info()

- 데이터 별 개수와 타입

df.describe()

- 기술 통계량

 

 

df.plot()

- 데이터 프레임은 plot도 가능 

 

 

sns.pairplot(df)

- 변수간 모든 상관관계 plot

- 변수 자기 자신은 그냥 히스토그램 플롯

- target에 대해 hue 지정시

 

 

 

 

와인 데이터 연습

 

1. 데이터 로드

2. 데이터 정보 보기

3. 데이터 프레임 만들기

 

 

* 그룹별 크기 출력

 

4. 시각화

4.1 sns.pairplot(df)

 

 

 

 

 

 

 

300x250

+ Recent posts