728x90

 

주성분 분석이란?

1933년 Hotelling은 p개의 변수를 p보다 적은 개수의 상호 독립적인 변수로 나타내는 방법을 개발

이 적은 갯수의 독립적인 변수를 주성분이라고 합니다.

 

주성분 분석이란 여러 변수들의 변량을 󰡔주성분󰡕 이라 불리는 보다 적은 수의

변수로 요약하고자 하는 기법입니다.

 

일반적으로 어떤 현상에 대하여 분석하고자 할 때에는 우선 관련된 여러 변수들을 조사하게 됩니다.

변수의 수가 많아질수록 모든 변수를 고려한 분석은 상당히 어렵게 됩니다.

그리하여 이 변수들을 간단하게 보다 적은 개수의 변수로 나타낼 수만 있으면 분석하거나 해석하는데 편리할 것입니다. 이런 작업을 󰡔차원축소(Dimension Reduction)󰡕라고 하고 이런 작업을 하는 것이 "주성분분석(Principal Component Analysis)"입니다.

 

SAS에서는 PROC PRINCOMP

R에서는 princomp( ), prcomp( )  함수를 사용합니다.

 

원래 자료의 형태는 N개의 관측치와 P개의 변수로 구성되어 있습니다.

이 자료를 P보다 작은 개수의 변수(주성분)로 차원 축소하여 설명하고자 하는 것이 주성분 분석입니다.

즉 관측변수 의 변량을 "주성분(Component)" 이라 불리는 적은 수의 변수 로 요약하는 것입니다.

이들 주성분은 다음과 같은 성질을 가지고 있습니다.

 

① 주성분은 원 변수의 선형결합(Linear Combination)이다.

② 제 1 주성분은 원 자료의 변량(Variance)을 최대로 설명하는 선형결합이다.

③ 제 2 주성분은 제 1 주성분으로 설명하지 않은 변량을 최대로 설명하는 선형결합이다.

④ 주성분의 공간은 원래 변인들의 공간에 있어서 직교방향(Orthogonal Direction)을 나타낸다.

⑤ 주성분점수(Principal Component Score)들은 서로 비상관관계(Uncorrelated)이다.

 

주성분은 원래 변수들의 변량에 대해서 가장 잘 설명하기만(?) 하는 원래 변수들의 선형결합입니다.

 

 

 

+ Recent posts