상관분석은 두 변수간의 (선형)상관관계를 분석하는 기법입니다.
일반적으로상관관계라는 말과상관계수라는 말을 너무 혼동하여 사용하고 있습니다.
예를 들어 "업무의 만족도와 성별의 상관 관계를 보고 싶다."라는 말은
"남녀별 업무의 만족도에 대한 차이가 있는가?" 즉 "t-검정을 실행하겠다."라는 의미이지
성별을 나타내는 변수와 업무만족도를 나타내는 변수의 상관계수를 구한다는 의미는 아닙니다.
문항에 따라 카이제곱법을 할 수도 있고 회귀분석을 행할 수도 있습니다.
여기서 말하는 상관계수는 두 「연속변수」의 「선형관계」의 정도를 나타내는 척도입니다.
상관계수는 연속형 변수인 경우에 의미가 있으며, 상관계수는 단지 두 변수의 선형(linear)관계의 정도만을
나타내기 때문에 2차, 3차 관계가 있는데도 불구하고 상관계수는 상관이 없는 것으로 나타나는 경우가 많습니다.
만약 한 변수(X)가 정확하게 다른 변수(Y)의 선형관계가 있으면 상관계수는 1 또는 –1 이고,
상관계수가 0인 경우는 한 변수로 다른 한 변수를 전혀 예측할 수 없다는 것을 의미합니다.
"제21강 회귀분석"에서 설명할 회귀분석은 변수 간 독립, 종속이 파악되는 경우에 적용하며,
변수 간 종속관계가 불분명하여 단지 두 변수간의 상관관계를 분석하는 것이 상관분석입니다.
다음은 키(hei), 몸무게(wei) 그리고 나이(age) 에 대한 6개의 데이터입니다.
이 6개의 데이터 상관관계를 구해 봅니다.
몸무게(wei) 키(hei) 나이(age) |
65 66 69 67 68 72 171 172 176 173 177 178 23 24 38 43 40 42 |
키, 몸무게와 나이의 상관계수를 구하는 프로그램과 실행결과는 다음과 같습니다.
* PROC CORR의 간단한 형태 – 제20강_상관분석.sas ;
/* ----------------------------------------------*/
DATA a1;
INPUT gender $ wei hei age;
CARDS;
F 65 171 23
F 66 172 24
F 69 176 38
M 67 173 43
M 68 177 40
M 72 178 42
;
PROC CORR;VAR wei hei age;
RUN;
키와 몸무게의 표본상관계수는 0.90855이며 “서로 상관이 없다”는 가설을 유의수준 0.05(>0.0122) 에서 기각합니다
'SAS강좌와 통계컨설팅 - 통계편 > 22. 상관분석' 카테고리의 다른 글
(R)제20강(10)_상관분석실습 : R 프로그램 (0) | 2021.12.21 |
---|---|
(P)제24강(02)_상관분석-Python-Pandas 프로그램 (0) | 2021.12.20 |
(P)제24강(01)_상관분석 실습 - Python-Numpy 프로그램 (0) | 2021.12.20 |
(S)제20강(02)_상관분석실습 - mtcars 데이터 (0) | 2021.12.20 |
(S)제20강(00)_상관분석 : 목차, 역사 (1) | 2021.12.20 |