주성분 분석이란?
1933년 Hotelling은 p개의 변수를 p보다 적은 개수의 상호 독립적인 변수로 나타내는 방법을 개발
이 적은 갯수의 독립적인 변수를 주성분이라고 합니다.
주성분 분석이란 여러 변수들의 변량을 주성분 이라 불리는 보다 적은 수의
변수로 요약하고자 하는 기법입니다.
일반적으로 어떤 현상에 대하여 분석하고자 할 때에는 우선 관련된 여러 변수들을 조사하게 됩니다.
변수의 수가 많아질수록 모든 변수를 고려한 분석은 상당히 어렵게 됩니다.
그리하여 이 변수들을 간단하게 보다 적은 개수의 변수로 나타낼 수만 있으면 분석하거나 해석하는데 편리할 것입니다. 이런 작업을 차원축소(Dimension Reduction)라고 하고 이런 작업을 하는 것이 "주성분분석(Principal Component Analysis)"입니다.
SAS에서는 PROC PRINCOMP
R에서는 princomp( ), prcomp( ) 함수를 사용합니다.
원래 자료의 형태는 N개의 관측치와 P개의 변수로 구성되어 있습니다.
이 자료를 P보다 작은 개수의 변수(주성분)로 차원 축소하여 설명하고자 하는 것이 주성분 분석입니다.
즉 관측변수 의 변량을 "주성분(Component)" 이라 불리는 적은 수의 변수 로 요약하는 것입니다.
이들 주성분은 다음과 같은 성질을 가지고 있습니다.
① 주성분은 원 변수의 선형결합(Linear Combination)이다.
② 제 1 주성분은 원 자료의 변량(Variance)을 최대로 설명하는 선형결합이다.
③ 제 2 주성분은 제 1 주성분으로 설명하지 않은 변량을 최대로 설명하는 선형결합이다.
④ 주성분의 공간은 원래 변인들의 공간에 있어서 직교방향(Orthogonal Direction)을 나타낸다.
⑤ 주성분점수(Principal Component Score)들은 서로 비상관관계(Uncorrelated)이다.
주성분은 원래 변수들의 변량에 대해서 가장 잘 설명하기만(?) 하는 원래 변수들의 선형결합입니다.
'SAS강좌와 통계컨설팅 - 통계편 > 26. 주성분분석' 카테고리의 다른 글
(S,R)제25강(02)_주성분분석 실습 - SAS와 R 비교 (0) | 2021.12.24 |
---|---|
(R)제25강(07)_주성분 분석 - 상관행렬 이용하기 (0) | 2021.12.24 |
(R)제25강(02)_주성분분석 실습 (0) | 2021.12.24 |
(S)제25강(00)_주성분분석 목차 (0) | 2021.12.24 |