728x90
  1. 분산분석법이란(ANOVA)
  2. 설문지 분석 - 분산분석법
  3. 일원분산분석법
    (1) 이론적 배경
    (2) 실습
  4. 이원분산분석법
    (1) 이론적 배경
    (2) 실습
    (3) 사후비고
    (4) 교호작용이 있는 경우
  5. 난괴법(Randomized Block Design)
  6. 분산분석법의 기타 논제
    (1) t 검정과의 비교
    (2) 비모수 분산분석법-클루스칼-왈리스 검정
  7. PROC ANOVA 의 형태
  8. R 프로그램 - 분산분석법

 

  1. 분산분석법이란(ANOVA)

분산분석법은 문자 그대로 분산(Variance)을 분석(Analyis)하는 기법입니다.

그래서 Analysis of Variance 줄여서 ANOVA 간단하지요. 간혹 F 검정이라고도 합니다.

왜냐하면 관련통계량이 F 분포를 따르니까요...

그럼 우선 분산(Variance) 이 문가를 알아야 되겠네요. 분산은 중학교 때 부터 배우는 내용으로 익히 들어서 알고 있는 내용일 겁니다.

(1) 관측된 자료에서 평균을 구한 다음.
(2) 각 관측치가 평균에서 얼마나 떨어져 있는가를 계산한 값 입니다.
(3) 그리하여 평균과 떨어진 값(거리) 을 제곱하여 합한 다음 그 평균을 구한 값입니다.

결국 제곱합(Sum of Squares)의 평균인 셈입니다. 이 값에 roor 즉 제곱근을 구하면 표준편차가 됩니다.

 

예를 들어 "세 학급의 국어 성적 차이가 있는가?" 같이 3그룹 이상의 평균값의 차이가 있는가? 분석할 때 사용되는 기법입니다. 그럼 두 학급의 국어 성적 차이가 있는가? 는 T-검정을 이용합니다.

 

세 학급의 국어 성적 데이터가 정규분포를 가정합니다.

(1) 세 학급의 데이터가 정규분포를 한다???

세 학급에서 각각 학급마다 독립적으로 여러 명(예 15명)의 학생을 선택하여

국어성적을 조사합니다. 

각 학급의 국어 성적이 정규분포를 따른다고 가정합니다.

정규분포를 따르지 않으면 어떻게 할까요? 그룹마다 샘플수가 30이 넘으면 정규분포를 가정하게 됩니다.

* 참고:

그런데 만약  15명의 국어 성적을 구하면 되는데, 

한 반에서 5명 정도 학생을 선발하여 3번의 시험을 치뤄 성적을 구해도 15명의 

성적을 구해게 됩니다.

이 때에는 각 학생마다 구한 3개의 성적은 같은 학생에서 구한 성적이므로

서로 독립적이지 않습니다. 이 때 반복분산분석법을 적용하게 됩니다.

 

(2) 정규분포를 하는 것은 알겠는데 그 다음은? 이제는 세 그룹의 분산이 동일하다고 가정합니다.

 

'SAS, R, Python 일반' 카테고리의 다른 글

주성분분석이란?  (0) 2020.05.30
1.3 SAS University Edition  (0) 2020.05.29
1.1 SAS란 무엇인가  (0) 2020.05.29
제01강. SAS설치와 실습  (0) 2020.05.29

+ Recent posts