- 분산분석법이란(ANOVA)
- 설문지 분석 - 분산분석법
- 일원분산분석법
(1) 이론적 배경
(2) 실습 - 이원분산분석법
(1) 이론적 배경
(2) 실습
(3) 사후비고
(4) 교호작용이 있는 경우 - 난괴법(Randomized Block Design)
- 분산분석법의 기타 논제
(1) t 검정과의 비교
(2) 비모수 분산분석법-클루스칼-왈리스 검정 - PROC ANOVA 의 형태
- R 프로그램 - 분산분석법
- 분산분석법이란(ANOVA)
분산분석법은 문자 그대로 분산(Variance)을 분석(Analyis)하는 기법입니다.
그래서 Analysis of Variance 줄여서 ANOVA 간단하지요. 간혹 F 검정이라고도 합니다.
왜냐하면 관련통계량이 F 분포를 따르니까요...
그럼 우선 분산(Variance) 이 문가를 알아야 되겠네요. 분산은 중학교 때 부터 배우는 내용으로 익히 들어서 알고 있는 내용일 겁니다.
(1) 관측된 자료에서 평균을 구한 다음.
(2) 각 관측치가 평균에서 얼마나 떨어져 있는가를 계산한 값 입니다.
(3) 그리하여 평균과 떨어진 값(거리) 을 제곱하여 합한 다음 그 평균을 구한 값입니다.
결국 제곱합(Sum of Squares)의 평균인 셈입니다. 이 값에 roor 즉 제곱근을 구하면 표준편차가 됩니다.
예를 들어 "세 학급의 국어 성적 차이가 있는가?" 같이 3그룹 이상의 평균값의 차이가 있는가? 분석할 때 사용되는 기법입니다. 그럼 두 학급의 국어 성적 차이가 있는가? 는 T-검정을 이용합니다.
세 학급의 국어 성적 데이터가 정규분포를 가정합니다.
(1) 세 학급의 데이터가 정규분포를 한다???
세 학급에서 각각 학급마다 독립적으로 여러 명(예 15명)의 학생을 선택하여
국어성적을 조사합니다.
각 학급의 국어 성적이 정규분포를 따른다고 가정합니다.
정규분포를 따르지 않으면 어떻게 할까요? 그룹마다 샘플수가 30이 넘으면 정규분포를 가정하게 됩니다.
* 참고:
그런데 만약 15명의 국어 성적을 구하면 되는데,
한 반에서 5명 정도 학생을 선발하여 3번의 시험을 치뤄 성적을 구해도 15명의
성적을 구해게 됩니다.
이 때에는 각 학생마다 구한 3개의 성적은 같은 학생에서 구한 성적이므로
서로 독립적이지 않습니다. 이 때 반복분산분석법을 적용하게 됩니다.
(2) 정규분포를 하는 것은 알겠는데 그 다음은? 이제는 세 그룹의 분산이 동일하다고 가정합니다.
'SAS연습 200제' 카테고리의 다른 글
주성분분석이란? (0) | 2020.05.30 |
---|---|
1.3 SAS University Edition (0) | 2020.05.29 |
1.1 SAS란 무엇인가 (0) | 2020.05.29 |
제01강. SAS설치와 실습 (0) | 2020.05.29 |