판별 분석 discriminant analysis
- 측정 변수들로 각 행, 개체들이 어느 그룹에 속하는지 판별하는 방법
- 주어진 데이터로 가장 잘 판별할수 있는 판별식을 만들어, 새로운 데이터를 분류함
판별 분석의 예시
- 은행이 기업에 대출 시, 대출 전 기업의 도산 가능 여부를 판별하는 경우
- 과거 도산 기업과 도산하지 않은 기업에 대한 데이터(자산, 부채, 이익 등)을 관측
- 도산 여부 판별할수 있는 판별식, 판별함수를 만들어 대출 받으려는 기업의 도산 가능 여부를 판별
선형 판별 함수 Linear Discriminant Function
- 판별 오류가 최소가 되는 선형 함수
- 람다 = 그룹 간 분산/그룹 내 분산, 람다가 최대가 되는 계수벡터 b를 구해야 함
=> 그룹 내부는 잘 뭉치고, 그룹 간에는 잘 떨어지는 판별식 계수를 구하라는 말.
- 선형 판별함수 식 Y = b' X
정준판별분석 canonial discriminant analysis
- 여러개 집단으로 분류하는 경우 판별분석.
-> 분류하고자 하는 집단이 3개 이상인 경우도 판별 분석이 가능하며, 판별식이 여러개가 됨.
- 정준 판별 함수는 정준 상관 분석으로 구할 수 있다.
참고 : 정준 상관분석 수행 과정
- X의 선형 결합 변수 W와 Y의 선형결합 변수 V 준비 -> Corr(W,V)
- Corr(W, V)가 최대로 하는 계수 벡터 b를 추정
정준 상관 분석의 판별 분석
- X의 선형 결합 변수 W와 라벨 Y에 대한 정준 상관분석 수행
-> 제1 정준 변수 = b1은 Y를 가장 잘 이진분류하는 판별함수의 계수벡터가 됨.
- 모든 그룹으로 나눌수 있도록 여러개의 정준 변수들은 생성
'수학 > 통계' 카테고리의 다른 글
다변량분석 - 6. 정준상관분석 Canonical Correlation Analysis (0) | 2020.11.26 |
---|---|
다변량분석 - 5. 다차원 척도법 MultiDemensional Scaling (0) | 2020.11.26 |
다변량분석 - 4. 인자 분석 (0) | 2020.11.10 |
통계 - 17. 통계적 추론에 대하여 (0) | 2020.11.10 |
다변량분석 - 3. 주성분 분석 (0) | 2020.11.09 |