영상 처리 응용 분야
- 자율 주행
- 수술 로봇
- 군사 로봇
- 탐사선 등
영상 처리 목표
1. 사람과 비슷한 인공 시각
- 어느 영상이든 사람의 인지능력을 사용하는 것 처럼 컴퓨터가 모방
=> 학습, 추론 등 인공지능 관련 문제가 해결되지 않는 이상 불가능
* 영상 처리의 어려움
- 역문제 : 입력 영상은 3차원 공간을 2차원으로 투영한 것. 영상 처리는 2차원 영상에서 3차원 공간을 이해해야함
=> 사람은 영상으로 공간 정보를 추론 할수 있으나 컴퓨터는 힘듬
- 불량 문제 : 답이 유일하지 않음 -> 영역 분할시 답이 다양함
- 변형 발생 : 기하학적 변환, 광도 변환 등이 동시에 발생
- 잡음
2. 특정 용도의 인공 시각
- 번호판 검출의 경우 : 직사각형 모양 찾기, 글자 인식
=> 사람의 인지 기능을 가진 인공 시각보다는 쉬움
컴퓨터 비전 처리 프로세스
1. 입력 영상
----------------------------------- 저급 영상 ---------------------------------
2. 전처리(영상처리) : 입력 영상을 목적에 알맞게 변환. ex) 노이즈 제거
3. 특징추출 feature extraction
- 특징 : 에지, 선분, 원, 코너, 텍스처 -> 이들로 특징 벡터 만듬
- 사용 특징 예시 : 얼굴 인식(Haar like), 사람 탐지(Histogram Of Gradient), 물체 인식 및 추적(SURF)
----------------------------------- 저급 영상 ---------------------------------
----------------------------------- 고급 영상 ---------------------------------
4. 해석
- 인식 : classification 수행
- 자율 주행 : 주행 방향 안내
* 데이터 베이스 생성 -> 분류기 학습 -> 후처리 -> 성능 개선
----------------------------------- 고급 영상 ---------------------------------
5. 고급 묘사
자료구조
- 기본 : 배열, 트리, 그래프
- 속도 개선 목적 : 힙, 해싱, 탐색 트리
- 추출 특징 및 기하학 요소 : 벡터, 행렬
활용 알고리즘
- 탐욕 방법, 동적 프로그래밍, 한정 분기
- 고속 매칭 : kd트리, 해싱 활용
수학적 기반
- 선형 대수 : 행렬 연산
- 미분 : 변화크기 측정
- 확률 : 의사 결정 및 분류
문제 풀이과정
1. 최적화 문제로 정리
- 비용 함수 정의
2. 수치적 방법으로 최적회 찾음
기계 학습 도구
- Neural Network, SVM, Adaboost, Markov Random Field
설계 과정
1. 문제 파악
- 문제를 풀기 위해 제약과 범위 설정 필요
- 얼굴 인식의 경우 : 정면만? 옆면도?
2. DB 수집
- 얼굴 인식기의 경우 얼굴 데이터베이스 구축 필요
- 예시
PASCAL VOC : 물체 인식 성능 데이터베이스 제공, 물체 종류와 위치 표시
버클리 데이터베이스 : 차량 번호판 글씨 제공
3. 알고리즘 설계, 구현
- 환경, 제약에 따라 결과 변화가 심함
- 많은 알고리즘 개발 -> 문제에 적절한 알고리즘을 선정 필요
=> 손찾기 : 손 모델 매칭, 지역 특징 활용, 영역 분할 아고리즘 등 다양한 경우의 수 사용 가능
* 좋은 알고리즘 찾는 방법
- 다양한 알고리즘을 사용해봄 -> 휴리스틱.
- 통찰 + 경험을 통해 시행착오 줄일 수 있음
- 데이터베이스와 성능 지표로 여러 알고리즘 성능 비교
4. 성능 평가
- TP True Positive 참 긍정
- TN True Negative 참 거짓
- FP False Positive 부정 긍정
- FN False Negative 부정 거짓
- 정확률 precision : TP/(TP + FP) -> 찾은것(TP, FP) 중에 올바른것(TP) 비율
- 재현율 recall : TP/(TP + FN) -> 찾아야하는 것(TP, FN)들 중에서 맞게 찾은(TP) 비율
- 강건함 robust : 환경 변화에도 성능을 유지하는 정도
학문 분류
- 영상 처리 : 입력 영상을 노이즈 제거나 왜곡 개선 등 적합하게 처리
- 컴퓨터 그래픽스 : 고급 정보로 새 영상 생성, 합성
- 컴퓨터 비전 : 입력 영상을 분석하여 고급 정보 출력
- 패턴 인식 : 특징 추출기로 특징 추출 -> 특징 벡터 생성, 분류기로 특징 벡터를 분류
영상 | 영상, 패턴 | ||
영상처리 | 컴퓨터 그래픽스 | 컴퓨터 비전 | 패턴인식 |
분류 |
'로봇 > 영상' 카테고리의 다른 글
컴퓨터 비전 - 6. 연결요소와 범람채움, 모폴로지 (0) | 2020.07.27 |
---|---|
컴퓨터 비전 - 5. 영역 연산과 기하학적 연산 (0) | 2020.07.27 |
컴퓨터 비전 - 4. 이미지 프로세스와 점 연산 (0) | 2020.07.27 |
컴퓨터 비전 - 3. 이진영상 (0) | 2020.07.27 |
컴퓨터 비전 - 2. 히스토그램 (0) | 2020.07.27 |