728x90

비모수 통계분석에 대한 생각...

 

통계학을 배우게 되면, 평균, 분산, 표준편차, 4분위수 등을 배우고

그런 다음 정규분포, t 분포, 카이제곱 분포, F 분포 등을 배우고

그런 다음 각종 통계 분석기법을 배웁니다.

 

그런 다음 비모수(?) 통계분석이란 다소 생소한 기법을 배우게 됩니다.

모수(?) 분석도 뭔지 잘 모르겠는데 거기에 "비"란 글자가 하나 더 붙은 비모수(?)...

비모수 분석은 "평균", "분산" 을 구하지 않고, t 검정이니, ANOAVA, 회귀분석이니

하는 것을 하지 않는 매우 쉬운 분석기법이라고 생각하시면 됩니다.

다시 설명하면 두 그룹 차이를 분석하려고 할 때, 두 그룹 각각 평균

(그러니까 숫자 2개)을 구하여 비교하는 t 검정 같은 것을 하지 않고

그냥 크기 순서대로 나열하여 어쩌고... 저쩌고... 하여 분석하는 기법입니다.

 

그런데 비모수분석기법이 낯설어지는 것은

자주 사용하지 않고, 이름이 비슷비슷하여 조금 헷갈리는 것입니다.

통계학에 나오는 수많은 기법과 분포를 외울 필요가 없듯이

비모수의 기법들도 그려려니 하면서 기본 개념만 이해하시면 될 듯합니다.  

 

"비모수 통계분석"이란 "모수 통계분석"처럼 분포에 근거를 하여 분석하는 기법이 아닙니다.

일반적으로 표본수가 적고, 분포에 대한 가정이 없고, 명목자료나 서열 자료에 적용하여 사용되는 기법입니다.

모집단의 분포를 잘 모르는 경우에 사용하는 것으로 분포에 대하여 정규분포 등을 가정하지 않습니다.

그리고 두 집단의 분산이 동일해야 한다든가 하는 가정도 필요하지 않습니다.

 

[천재들의 주사위]에서

1940년 "아메리카 사이아나미드" 에서 일하던 화학자 "윌콕슨"은 

통계힉 문제 하나 때문에 골머리를 앓고 있었다.

그는 "스튜던트"의 t검정, 피셔의 분산분석 등을 사용해서 서로 다른 화학처리 방법들의

효과를 비교하기 위해 일련의 가설검정을 수행하던 중이었다.....

윌콕선은 예외적인 값들이 결과에 상당한 영량을준다는 것을 알아냈다.

즉 그러한 값들이 t값을 상당히 작게 만드는 요인이 되고 있었다...

1945년 그의 논문이 출간했다.

윌콕선도 바이오메트릭스의 편집위원들도

만(Henry B. Mann)이라는 경제학자와 위트니(D. Ranson Whitney) 라는 오하이오 주립대학의 통계학과 대학원생이

이와 비슷한 문제를 연구 중이라는 사실을 알지 못했다. 이들은 예를 들어 1940년의 임금분포는 1944년의 임금분포에 

비해서 작다는 식으로 통계분포를 순서지을 수 있는 방법을 연구하고 있었다.

윌콕선이 얻은 결과와 거의 같음

윌콕선의 검정방법과 만-위트니의검정방법이 매우 밀접하게 연관되어 있으며, 두 방법이 동일한 t값을 유도한다는 것이

쉽게 밝혀졌다.

 

 

비모수 통계분석의 종류

 

1. 분포에 대한 분석
  카이제곱검정 : 각 범주에 속하는 확률이 같은가?
  이항검정 : 범주가 2개인 경우, ‘1’ 의 확률을 검정 = 인가?
  Kolmogorov-Smirnov 검정 관측치 분포가 어떤 분포를 따르는지 검정
   Run 검정 발생순서가 랜덤인지 아닌지 검정

 

2. (독립) 두 그룹 검정
윌콕슨 순위합 검정 = 맨 휘트니 U 검정

 

3. (대웅) 두 그룹 검정
윌콕슨의 부호 순위 검정

 

4. (독립) 세 그룹 이상 검정
클루스칼-왈라스 검정

 

5. (대응) 세 그룹 이상 검정
프리드만 검정
켄달 W 검정

+ Recent posts