728x90

영상 처리 응용 분야

- 자율 주행

- 수술 로봇

- 군사 로봇

- 탐사선 등

 

 

 

 

 

 

영상 처리 목표

1. 사람과 비슷한 인공 시각

- 어느 영상이든 사람의 인지능력을 사용하는 것 처럼 컴퓨터가 모방

 => 학습, 추론 등 인공지능 관련 문제가 해결되지 않는 이상 불가능

 

 

* 영상 처리의 어려움

- 역문제 : 입력 영상은 3차원 공간을 2차원으로 투영한 것. 영상 처리는 2차원 영상에서 3차원 공간을 이해해야함

 => 사람은 영상으로 공간 정보를 추론 할수 있으나 컴퓨터는 힘듬

- 불량 문제 : 답이 유일하지 않음 -> 영역 분할시 답이 다양함

- 변형 발생 : 기하학적 변환, 광도 변환 등이 동시에 발생

- 잡음

 

2. 특정 용도의 인공 시각
- 번호판 검출의 경우 : 직사각형 모양 찾기, 글자 인식

 => 사람의 인지 기능을 가진 인공 시각보다는 쉬움

 

 

 

 

 

 

 

 

컴퓨터 비전 처리 프로세스

1. 입력 영상

----------------------------------- 저급 영상 ---------------------------------

2. 전처리(영상처리) : 입력 영상을 목적에 알맞게 변환. ex) 노이즈 제거

3. 특징추출 feature extraction

 - 특징 : 에지, 선분, 원, 코너, 텍스처 -> 이들로 특징 벡터 만듬

 - 사용 특징 예시 : 얼굴 인식(Haar like), 사람 탐지(Histogram Of Gradient), 물체 인식 및 추적(SURF)

----------------------------------- 저급 영상 ---------------------------------

----------------------------------- 고급 영상 ---------------------------------

4. 해석

- 인식 : classification 수행

- 자율 주행 : 주행 방향 안내

* 데이터 베이스 생성 -> 분류기 학습 -> 후처리 -> 성능 개선

----------------------------------- 고급 영상 ---------------------------------

5. 고급 묘사

 

 

 

 

 

 

 

 

자료구조

- 기본 : 배열, 트리, 그래프

- 속도 개선 목적 : 힙, 해싱, 탐색 트리 

- 추출 특징 및 기하학 요소 : 벡터, 행렬

 

활용 알고리즘

- 탐욕 방법, 동적 프로그래밍, 한정 분기

- 고속 매칭 : kd트리, 해싱 활용

 

수학적 기반

- 선형 대수 : 행렬 연산

- 미분 : 변화크기 측정

- 확률 : 의사 결정 및 분류

 

문제 풀이과정

1. 최적화 문제로 정리

- 비용 함수 정의

2. 수치적 방법으로 최적회 찾음

 

기계 학습 도구

- Neural Network, SVM, Adaboost, Markov Random Field

 

 

 

 

 

 

 

 

 

 

 

 

 

설계 과정

1. 문제 파악

- 문제를 풀기 위해 제약과 범위 설정 필요

- 얼굴 인식의 경우 : 정면만? 옆면도?

 

2. DB 수집

- 얼굴 인식기의 경우 얼굴 데이터베이스 구축 필요

- 예시

    PASCAL VOC : 물체 인식 성능 데이터베이스 제공, 물체 종류와 위치 표시 

    버클리 데이터베이스 : 차량 번호판 글씨 제공

 

3. 알고리즘 설계, 구현

- 환경, 제약에 따라 결과 변화가 심함

- 많은 알고리즘 개발 -> 문제에 적절한 알고리즘을 선정 필요

 => 손찾기 : 손 모델 매칭, 지역 특징 활용, 영역 분할 아고리즘 등 다양한 경우의 수 사용 가능

 

* 좋은 알고리즘 찾는 방법

 - 다양한 알고리즘을 사용해봄 -> 휴리스틱.

 - 통찰 + 경험을 통해 시행착오 줄일 수 있음

 - 데이터베이스와 성능 지표로 여러 알고리즘 성능 비교

 

4. 성능 평가

 - TP True Positive 참 긍정 

 - TN True Negative 참 거짓

 - FP False Positive 부정 긍정

 - FN False Negative 부정 거짓

 - 정확률 precision : TP/(TP + FP) -> 찾은것(TP, FP) 중에 올바른것(TP) 비율

 - 재현율 recall : TP/(TP + FN) -> 찾아야하는 것(TP, FN)들 중에서 맞게 찾은(TP) 비율

 - 강건함 robust : 환경 변화에도 성능을 유지하는 정도

 

 

 

 

 

 

 

 

학문 분류

- 영상 처리 : 입력 영상을 노이즈 제거나 왜곡 개선 등 적합하게 처리

- 컴퓨터 그래픽스 : 고급 정보로 새 영상 생성, 합성

- 컴퓨터 비전 : 입력 영상을 분석하여 고급 정보 출력

- 패턴 인식 : 특징 추출기로 특징 추출 -> 특징 벡터 생성, 분류기로 특징 벡터를 분류

영상 영상, 패턴
영상처리 컴퓨터 그래픽스 컴퓨터 비전 패턴인식
      분류

 

 

 

 

 

 

300x250

+ Recent posts