728x90

 

 

이번 주에는 물체 탐지에 대해서 배울건데, 컴퓨터비전의 한 분야로 최근 크게 급성장함.

 

물체 탐지 object detection를 구현하기에 앞서 물체 위치 추정 object localization을 먼저 해야함.

 

이것들이 무엇인지 알아보자

 

 

이미지 분류는 이미지가 주어지면, 라벨을 구하는게 분류

이미지 분류와 위치 추정의 경우 이미지가 주어질때, 라벨과 해당 물체가 이미지의 어디에 존재있는지 알려줌

물체 탐지의 경우, 이미지 상에 존재하는 여러 물체들을 찾아내고 위치와 라벨을 알려줌.

 

이미지 분류, 이미지분류 + 위치 추정 => 이미지 상의 한 물체만 찾음

물체 탐지 => 여러 물체들을 찾아낸다.

 

위치 추정을 배우면 물체 탐지를 공부하는데 도움 되겠다.

 

 

이미지를 합성곱신경망에다가 넣으면 특징 벡터를 구할거고, 소프트맥스 함수를 적용해서 이 이미지가 무엇인지 찾아내겠다.

일반적인 분류 파이프라인이 됨.

 

 

 

 

그러면 이미지에 있는 차량의 위치를 어떻게 추정해낼수 있을까?

 

신경망이 바운딩 박스를 출력하도록 고치면 되겠다. 

 

바운딩 박스는 4개의 수 bx, by, bh, bw로 구성됨.

 

bx, by는 바운딩 박스의 중심점, bh, bw는 바운딩 박스의 높이와 폭

 

 

훈련셋은 라벨 뿐만이 아니라 바운딩 박스에 대한 정보도 가지고 있어야 지도 학습에 사용할수 있겠다.

 

이 예시의 경우 bx = 0.5, by = 0.7, bh = 0.3, bw = 0.4

* bh는 바운딩 박스의 높이가 이미지 높이의 30%정도 되기때문 

 

 

 

좌측의 클래스들과 우측의 바운딩 박스와 관련된 4개의 수를 출력함.

그러면 타겟 라벨 y를 정의해보자.

 

가장 먼저 pc는 물체일 확률로 해당 바운딩 박스가 배경인 경우 0이 된다.

다음으로 bx, by, bh, bw로 바운딩 박스에 대한 것이 있고

마지막으로 c1, c2, c3으로 이 이미지의 클래스들이 들어가겠다.

 

 

 

한번 예시를 보면

위 좌측 이미지가 x로 들어가면

 

위 이미지의 바운딩 박스에 차가 있으므로

y = [1, bx, by, bh, bw, 0, 1, 0] 이 되겠다.

 

 

위 우측 이미지가 x로 들어가는 경우

y = [0, ? ? . .. .]로 물체가 존재하지 않음.

 

훈련셋의 라벨은 위와 같은 형태로 정의되어야 한다.

 

 

 

 

마지막으로 비용함수를 정리하자면

 

L(hat_y, y)은 어떻게될까?

 

y_1 = 1 인 경우(pc = 1, 해당 바운딩 박스에 물체가 존재할때)에 제곱합.

 

y_1 = 0인 경우 (hat_y_1 - y_1)^2이 되겠다. 

*y_1 = 0일때 나머지 원소들은 상관없기 때문.

 

 

여기서는 간단하게 설명하고자 제곱 오차를 사용했으나

실제로는 로그 가능도 비용을 c1, c2, c3 계산에 써도 되고,

바운딩 박스 좌표계들을 계산하는데 제곱오차를

pc의 경우 로지스틱 회귀 비용을 사용해서 구할수도 있겠다.

 

 

지금까지 어떻게 물체를 분류하고, 위치 추정을 하는지 다룸.

신경망이 실제 물체 위치를 출력하도록 고쳐 유용함을 알 수 있었음.

다음 영상에서는 어떻게 신경망이 회귀로 실제 수들을 출력하는지 알아보자.

 

 

 

 

300x250
728x90

 

지도학습이 무엇인지 알아보자.

- 지도학습은 입력 x를 받아 출력 y를 구하도록함.

- 예시 : 주택 가격 예측, 온라인 광고 클릭 여부, 이미지 태깅, 음성 인식, 이미지와 레이더 정보를 이용한 차 위치 추정

 

 

 

표준 신경망

CNN

RNN은 위와 같이 생김.

 

cnn은 이미지 데이터 처리에 좋음

rnn은 1차원 시퀀스 데이터 처리에 좋다.

 

 

 

지도 학습에 사용하는 데이터로

구조화된 데이터와 비구조화된 데이터가 있음

 

구조회된 데이터 : 데이터베이스 같은 형태. 컬럼과 행으로 구성

비구조화된 데이터 : 오디오, 이미지, 텍스트 같은 데이터들을 말함. 이들의 특징은 구조화된 데이터보다 계산하기 힘듬. 사람이 이해하기 쉽지만.

 

인공 신경망의 놀라운 점은 딥러닝은 이전보다 비구조화된 데이터를 더 잘 처리할 수 있게됨.

 

 

 

신경망은 지도 학습을 통해 수많은 경제적인 가치들을 만들어냄. 하지만 이 신경망의 개념이 수십년전에 나왔지만 왜 최근에서야 크게 유행했는지 다음시간에 알아봅시다.

 

 

 

 

 

300x250
728x90

 이번 강의를 통해서 신경망이 뭔지 이야기해보자

 

 

 

주택 가격 예측하기

- 크기

- 침실 개수

=> 가족 구성원 수

 

- 우편번호 => 도보가능 여부

- 부

=> 좋은 학군 여부

 

- 가족 구성원

- 도보가능 여부

- 좋은 학군 여부

=> 주택 가격 y

 

신경망은 어떻게 이런 x들을 가지고 가격 y를 예측할 수 있을까

 

 

 

좌측의 입력들로 

y를 예측해낸다.

 

중간의 세 원은 은닉 유닛이라고 부름.

은닉 유닛은 입력 특징들을 받아 결정됨

은닉층 가족 구성원 수 family size는 x1, x2로 결정

 

모든 입력 특징들은 중간의 은닉층들과 연결되어, 출력 y를 구함.

 

 

 

 

신경망이 지도학습 환경에서 좋은걸 알 수 있었음.

 

 

 

 

300x250
728x90

 

 

인공지능이란?

- 인공지능은 새로운 열광적인 기술

- 이 열광적인 기술을 통해 운송, 제조, 헬스케어, 통신 등 수 많은 산업에서 변혁을 이끌고 있음.

- 인공지능은 새로운 산업혁명이라 부를만함.

 

 

 

 

 

 

우리가 배울 내용들

1. 인공 신경망과 딥러닝

2. 하이퍼 파라미터 튜닝과, 규제, 최적화를 통해 인공신경망을 개선시켜보자.

3. 머신러닝 프로젝트를 만들어보자

4. 합성곱 신경망 

5. 시퀀스 모델을 통해 자연어를 처리하여보자

 

 

 

 

정리

- 이 코스 내용들을 공부하면서 좋은 모델들을 만들고 커리어 잘 준비하자

 

 

 

 

 

 

 

300x250

+ Recent posts