728x90

상관분석은 두 변수간의 (선형)상관관계를 분석하는 기법입니다.

 

일반적으로󰡒상관관계󰡓라는 말과󰡒상관계수󰡓라는 말을 너무 혼동하여 사용하고 있습니다.

예를 들어 "업무의 만족도와 성별의 상관 관계를 보고 싶다."라는 말은

"남녀별 업무의 만족도에 대한 차이가 있는가?" 즉 "t-검정을 실행하겠다."라는 의미이지

성별을 나타내는 변수와 업무만족도를 나타내는 변수의 상관계수를 구한다는 의미는 아닙니다.

문항에 따라 카이제곱법을 할 수도 있고 회귀분석을 행할 수도 있습니다.

 

여기서 말하는 상관계수는 두 연속변수선형관계의 정도를 나타내는 척도입니다.

상관계수는 연속형 변수인 경우에 의미가 있으며, 상관계수는 단지 두 변수의 선형(linear)관계의 정도만을

나타내기 때문에 2, 3차 관계가 있는데도 불구하고 상관계수는 상관이 없는 것으로 나타나는 경우가 많습니다.

만약 한 변수(X)가 정확하게 다른 변수(Y)의 선형관계가 있으면 상관계수는 1 또는 1 이고,

상관계수가 0인 경우는 한 변수로 다른 한 변수를 전혀 예측할 수 없다는 것을 의미합니다.

"제21강 회귀분석"에서 설명할 회귀분석은 변수 간 독립, 종속이 파악되는 경우에 적용하며,

변수 간 종속관계가 불분명하여 단지 두 변수간의 상관관계를 분석하는 것이 상관분석입니다.

 

다음은 키(hei), 몸무게(wei) 그리고 나이(age) 에 대한 6개의 데이터입니다.

6개의 데이터 상관관계를 구해 봅니다.

몸무게(wei)
(hei)
나이(age)
65 66 69 67 68 72
171 172 176 173 177 178
23 24 38 43 40 42

 

, 몸무게와 나이의 상관계수를 구하는 프로그램과 실행결과는 다음과 같습니다.

 

* PROC CORR의 간단한 형태 20_상관분석.sas ;

/* ----------------------------------------------*/

 DATA a1;

 INPUT gender $ wei hei age;

 CARDS;

 F 65 171 23

 F 66 172 24

 F 69 176 38 

 M 67 173 43 

 M 68 177 40

 M 72 178 42

;

PROC CORR;VAR wei hei age;

RUN;

 

s_cor_cor_01

키와 몸무게의 표본상관계수는 0.90855이며 서로 상관이 없다는 가설을 유의수준 0.05(>0.0122) 에서 기각합니다

+ Recent posts