728x90

링크

www.youtube.com/watch?v=0nqvO3AM2Vw

 

랙처 1은 나중에 하고

 

 

 

 

이미지 분류

- 입력 이미지가 주어질때, 이 이미지가 무엇인지 분류하는 문제

 

이미지 인식에서의 문제 : 시멘틱 갭(인지 능력의 차이)

- 우리는 고양이인걸 바로 인지할수 있음

- 컴퓨터는 사람처럼 인지 할수 없고, 컬러 이미지의 경우 3차원의 형태(행 x 렬 x 채널)로 됨

 

 

이미지 인식에서의 도전 과제

1. 관점 변화에 따른 인식

- 위치나 각도에 따라 이미지 픽셀값이 변함

- 관점 변화에 따른 강인한 알고리즘이 필요

 

2. 동일 클래스 다양성에 따른 인식 문제

- 전부다 고양이이나 서로 다르게 생김 

3. 하부 카테고리 분류 문제

- 고양이에도 여러 종이 있으나 생김새가 비슷할 경우 분류하기 어려움

 

4. 배경에 의해 분류하기 힘든 경우

- 물체가 배경으로 인해 구분하기 힘든 경우에도 분류할수 있어야 함.

 

 

5. 조명 변화

- 다양한 조명에서도 고양이를 분류할수 있어야함.

 

5. 형태 변화

- 분류하고자 하는 물체가 다른 자세로 되어 있더라도 분류할 수 있어야 함.

 

6. 장애물

- 분류하고자 하는 물체가 가려져 있더라도 분류할수 있어야 함.

 

 

이미지 분류의 활용 예시

 

이미지 분류의 활용 예시

- 의료 이미지를 이용한 종양 양성, 음성 분류

- 망원경으로 얻은 영상으로 은하 분류

- 고래 인식 등

 

이미지 분류를 이용한 물체 검출

- 특정 박스를 이동시키면서, 해당 박스 이미지를 분류함으로서 물체를 검출

 

 

 

 

 

 

그러면 어떻게 이미지 분류기를 구현할까?

 

어떻게 구현할지 명확한 방법은 없음.

 

 

에지나 코너를 사용하는 경우는 어떨까?

- 물체의 외형으로 사람의 경우 바로 인식할수는 있겠지만

- 컴퓨터로 검출할때 필요한 에지를 검출하지 못할수 있고, 너무 많은 코너를 검출 시 계산 복잡도가 크게 증가하여 적합하지 않음.

 

 

 

머신러닝 : 데이터 주도 방법

- 물체의 외형같이 사람이 활용 가능한 지식을 활용하는 것이 아닌 데이터로부터 학습하는 방법

 

분류기의 기본 함수

- train

- predict

 

이미지 분류 데이터 셋

1. MNIST

10 클래스

28 x 28 흑백 이미지

50k 훈련 이미지

10k 테스트 이미지

 

 

2. CIFAR10

10 클래스

50k 훈련 이미지 - 1클래스당 5K

10k 테스트 이미지 - 1클래스당 1K

32 x 32 RGB 이미지

 

3. ImageNet

1000 클래스

~1.3M 훈련 데이터(클래스당 ~1.3k)

50K 검증 이미지 (클래스당 50)

100K 테스트 이미지(클래스당 100)

256 x 256 크기의 컬러 이미지

 

 

 

훈련에 사용하는 픽셀 갯수

 

 

최근접 이웃 분류기 구현하기

- 훈련 함수에서 모든 데이터와 라벨 기억

- 예측 함수에서 입력 이미지와 거리가 가장 가까운 이미지의 라벨을 구함

 -> 거리를 구할 방법이 요구됨.

 

 

 

 

 

 

거리 지표

1. L1 거리(맨해탄 거리)

- 모든 요소들의 차이 합

 

300x250

+ Recent posts