링크
www.youtube.com/watch?v=0nqvO3AM2Vw
랙처 1은 나중에 하고
이미지 분류
- 입력 이미지가 주어질때, 이 이미지가 무엇인지 분류하는 문제
이미지 인식에서의 문제 : 시멘틱 갭(인지 능력의 차이)
- 우리는 고양이인걸 바로 인지할수 있음
- 컴퓨터는 사람처럼 인지 할수 없고, 컬러 이미지의 경우 3차원의 형태(행 x 렬 x 채널)로 됨
이미지 인식에서의 도전 과제
1. 관점 변화에 따른 인식
- 위치나 각도에 따라 이미지 픽셀값이 변함
- 관점 변화에 따른 강인한 알고리즘이 필요
2. 동일 클래스 다양성에 따른 인식 문제
- 전부다 고양이이나 서로 다르게 생김
3. 하부 카테고리 분류 문제
- 고양이에도 여러 종이 있으나 생김새가 비슷할 경우 분류하기 어려움
4. 배경에 의해 분류하기 힘든 경우
- 물체가 배경으로 인해 구분하기 힘든 경우에도 분류할수 있어야 함.
5. 조명 변화
- 다양한 조명에서도 고양이를 분류할수 있어야함.
5. 형태 변화
- 분류하고자 하는 물체가 다른 자세로 되어 있더라도 분류할 수 있어야 함.
6. 장애물
- 분류하고자 하는 물체가 가려져 있더라도 분류할수 있어야 함.
이미지 분류의 활용 예시
이미지 분류의 활용 예시
- 의료 이미지를 이용한 종양 양성, 음성 분류
- 망원경으로 얻은 영상으로 은하 분류
- 고래 인식 등
이미지 분류를 이용한 물체 검출
- 특정 박스를 이동시키면서, 해당 박스 이미지를 분류함으로서 물체를 검출
그러면 어떻게 이미지 분류기를 구현할까?
어떻게 구현할지 명확한 방법은 없음.
에지나 코너를 사용하는 경우는 어떨까?
- 물체의 외형으로 사람의 경우 바로 인식할수는 있겠지만
- 컴퓨터로 검출할때 필요한 에지를 검출하지 못할수 있고, 너무 많은 코너를 검출 시 계산 복잡도가 크게 증가하여 적합하지 않음.
머신러닝 : 데이터 주도 방법
- 물체의 외형같이 사람이 활용 가능한 지식을 활용하는 것이 아닌 데이터로부터 학습하는 방법
분류기의 기본 함수
- train
- predict
이미지 분류 데이터 셋
1. MNIST
10 클래스
28 x 28 흑백 이미지
50k 훈련 이미지
10k 테스트 이미지
2. CIFAR10
10 클래스
50k 훈련 이미지 - 1클래스당 5K
10k 테스트 이미지 - 1클래스당 1K
32 x 32 RGB 이미지
3. ImageNet
1000 클래스
~1.3M 훈련 데이터(클래스당 ~1.3k)
50K 검증 이미지 (클래스당 50)
100K 테스트 이미지(클래스당 100)
256 x 256 크기의 컬러 이미지
훈련에 사용하는 픽셀 갯수
최근접 이웃 분류기 구현하기
- 훈련 함수에서 모든 데이터와 라벨 기억
- 예측 함수에서 입력 이미지와 거리가 가장 가까운 이미지의 라벨을 구함
-> 거리를 구할 방법이 요구됨.
거리 지표
1. L1 거리(맨해탄 거리)
- 모든 요소들의 차이 합
'번역 > 컴퓨터비전딥러닝' 카테고리의 다른 글
딥러닝비전 5. 신경망 2 - 신경망 근사화와 컨벡스 함수 (0) | 2021.01.29 |
---|---|
딥러닝비전-5. 신경망 (0) | 2021.01.25 |
딥러닝비전-4. 최적화 (0) | 2021.01.20 |
딥러닝비전-3.4 소프트맥스분류기와 SVM 대 소프트맥스 (0) | 2021.01.16 |
딥러닝비전-3. 선형 분류기 (0) | 2021.01.11 |