728x90

25.1 주성분분석이란?

25.2 주성분분석 실습

25.3 주성분분석의 이론적 배경

25.3.1 선형결합과 설명력

25.3.2 1 주성분과 제2 주성분

25.3.3 고유치(Eigenvalue)

25.4 주성분 구하는 공식

25.5 주성분 점수 구하기

25.6 주성분 개수의 결정

25.7 상관행렬을 이용한 주성분분석

25.7.1 상관행렬을 구하고 분석하기

25.7.2 상관행렬 직접 이용하기

25.8 분석결과를 데이터셋으로 저장하기

25.9 주성분분석 예제 USArrests 데이터

25.10 PROC PRINCOMP의 형태

25.11 R 프로그램 주성분분석

728x90

그 그룹이 서로 짝을 이루는 경우에 두 그룹의 평균치 차이가 있는지를 검정하는

비모수적 검정 방법을 윌콕슨 부호순위 검정(Sign rank test) 라고 합니다.

모수적기법의 쌍체비교 t검정에 해당됩니다.

윌콕슨 부호순위 검정(Signed-rank Test)는 하나의 표본에서 특정값을 기준으로 하여

+ 부호의 개수와 부호의 개수가 많은가? 적은가 또는 두 표본 간에 값의 차이에 대한 검정을 합니다.

 

/*--------------------------------------------------------*/

/* 쌍체비교의 부호순위 검정 */

/*--------------------------------------------------------*/

1 DATA a;INPUT pre1 pre2;

2 diff=pre2-pre1;

3 CARDS;

4 80 82

5 73 71

6 70 95

7 60 69

8 88 100

9 84 71

10 65 75

11 37 60

12 91 95

13 52 65

14 ;

15 PROC UNIVARIATE NORMAL;VAR diff;

16 RUN;

 

s_non_ran_01

728x90

18t 검정에서 두 집단의 모평균의 차이가 있는가를 분석하기 위해

모수적 통계분석 방법인 t 검정을 설명하였습니다.

t검정에 대응하는 비모수적 방법으로 순위합(rank sum test) 검정이 있습니다.

윌콕선(Wilcoxon)의 순위합 검정과 맨-위트니(Mann-whitney)U검정은 동일하며

-위트니-윌콕선 순위합 검정이라고도 불립니다.

모수적 방법인 t 검정에서는 모집단이 정규분포를 따른다는 가정이 필요하고, 평균과 분산을 계산하지만

비모수적 방법에서는 모집단이 정규분포를 따른다는 가정도 필요하지 않고,

평균과 분산 등을 계산하지 않습니다.

(1) 두 집단의 관측치를 통합하여 하나의 집단으로 구성한 다음,

(2) 크기순으로 정렬하여 순서를 매긴 다음,

(3) 두 집단의 순위에 대한 분석을 합니다.

 

두 집단의 관측치를 통합하여 하나의 집단으로 구성한 다음,

크기 순으로 정렬하여 순서를 매긴다. 크기가 같으면 가운데 값을 지정하고,

각 집단별 순위의 합계를 구한 다음,

합계를 이용하여 집단별로 U 값을 계산하여,

U 값을 기준으로 분석하는 기법입니다.

 

학급 1 학급 2

60 64

66 69

72 75

78 81

84 87

80

 

 원래 두 학급의 데이터를 학급 구분없이 하나의 집단으로 묶은 다음, 점수에 정렬한 다음 순위를 매깁니다. 그런 다음 각 학급별로 순위를 분석하게 됩니다. 학급1에 속한 관측치의 보면 1, 3, 5, 7, 10 등이며, 학급2에 속한 관측치의 순위를 보면 2, 4. 6. 8, 9, 11 등이 됩니다.

 

원래   데이터    크기순으로 정렬 순위

학급1  60        학급1  60        1

학급1  66        학급2  64        2

학급1  72        학급1  66        3

학급1  78        학급2  69        4

학급1  84        학급1  72        5

학급80        학급2  75        6

학급2  64        학급1  78        7

학급2  69        학급80        8

학급2  75        학급2  81        9

학급2  81        학급1  84        10

학급2  87        학급2  87        11

 

/*-------------------------------------------------*/

/* 윌콕선의 순위합 검정 */

/*-------------------------------------------------*/

1 DATA a1;INPUT group score @@;

2 CARDS;

3 1 60 2 64

4 1 66 2 69

5 1 72 2 75

6 1 78 2 81

7 1 84 2 87

8 1 80 2

9 ;

10 PROC NPAR1WAY WILCOXON;

11 CLASS group;

12 VAR score;

13 RUN;

 

 

728x90

12.1 비모수 통계분석이란?

12.2 두 집단 독립 - 윌콕선 순위합 검정

12.2.1 윌콕선의 순위합 검정 - 실습

12.2.2 윌콕선의 순위합 검정 - 이론적 배경

12.3 두 집단 쌍체 비교 윌콕선 부호순위 검정

12.4 세 집단 이상 독립 - Kruskal-Wallis 검정

12.5 k 집단 대응 비교 프리드만 검정

12.6 비모수 상관분석

12.6.1 스피어만의 순위상관계수

12.6.2 켄달의 타우

12.7 기타 비모수 기법들

12.7.1 메디안 검정

12.7.2 (Run)검정

12.7.3 콜모고르프-스미르노프 검정 단일표본 검정

12.8 PROC NPAR1WAY의 형태

 

728x90

비모수 통계분석에 대한 생각...

 

통계학을 배우게 되면, 평균, 분산, 표준편차, 4분위수 등을 배우고

그런 다음 정규분포, t 분포, 카이제곱 분포, F 분포 등을 배우고

그런 다음 각종 통계 분석기법을 배웁니다.

 

그런 다음 비모수(?) 통계분석이란 다소 생소한 기법을 배우게 됩니다.

모수(?) 분석도 뭔지 잘 모르겠는데 거기에 "비"란 글자가 하나 더 붙은 비모수(?)...

비모수 분석은 "평균", "분산" 을 구하지 않고, t 검정이니, ANOAVA, 회귀분석이니

하는 것을 하지 않는 매우 쉬운 분석기법이라고 생각하시면 됩니다.

다시 설명하면 두 그룹 차이를 분석하려고 할 때, 두 그룹 각각 평균

(그러니까 숫자 2개)을 구하여 비교하는 t 검정 같은 것을 하지 않고

그냥 크기 순서대로 나열하여 어쩌고... 저쩌고... 하여 분석하는 기법입니다.

 

그런데 비모수분석기법이 낯설어지는 것은

자주 사용하지 않고, 이름이 비슷비슷하여 조금 헷갈리는 것입니다.

통계학에 나오는 수많은 기법과 분포를 외울 필요가 없듯이

비모수의 기법들도 그려려니 하면서 기본 개념만 이해하시면 될 듯합니다.  

 

"비모수 통계분석"이란 "모수 통계분석"처럼 분포에 근거를 하여 분석하는 기법이 아닙니다.

일반적으로 표본수가 적고, 분포에 대한 가정이 없고, 명목자료나 서열 자료에 적용하여 사용되는 기법입니다.

모집단의 분포를 잘 모르는 경우에 사용하는 것으로 분포에 대하여 정규분포 등을 가정하지 않습니다.

그리고 두 집단의 분산이 동일해야 한다든가 하는 가정도 필요하지 않습니다.

 

[천재들의 주사위]에서

1940년 "아메리카 사이아나미드" 에서 일하던 화학자 "윌콕슨"은 

통계힉 문제 하나 때문에 골머리를 앓고 있었다.

그는 "스튜던트"의 t검정, 피셔의 분산분석 등을 사용해서 서로 다른 화학처리 방법들의

효과를 비교하기 위해 일련의 가설검정을 수행하던 중이었다.....

윌콕선은 예외적인 값들이 결과에 상당한 영량을준다는 것을 알아냈다.

즉 그러한 값들이 t값을 상당히 작게 만드는 요인이 되고 있었다...

1945년 그의 논문이 출간했다.

윌콕선도 바이오메트릭스의 편집위원들도

만(Henry B. Mann)이라는 경제학자와 위트니(D. Ranson Whitney) 라는 오하이오 주립대학의 통계학과 대학원생이

이와 비슷한 문제를 연구 중이라는 사실을 알지 못했다. 이들은 예를 들어 1940년의 임금분포는 1944년의 임금분포에 

비해서 작다는 식으로 통계분포를 순서지을 수 있는 방법을 연구하고 있었다.

윌콕선이 얻은 결과와 거의 같음

윌콕선의 검정방법과 만-위트니의검정방법이 매우 밀접하게 연관되어 있으며, 두 방법이 동일한 t값을 유도한다는 것이

쉽게 밝혀졌다.

 

 

비모수 통계분석의 종류

 

1. 분포에 대한 분석
  카이제곱검정 : 각 범주에 속하는 확률이 같은가?
  이항검정 : 범주가 2개인 경우, ‘1’ 의 확률을 검정 = 인가?
  Kolmogorov-Smirnov 검정 관측치 분포가 어떤 분포를 따르는지 검정
   Run 검정 발생순서가 랜덤인지 아닌지 검정

 

2. (독립) 두 그룹 검정
윌콕슨 순위합 검정 = 맨 휘트니 U 검정

 

3. (대웅) 두 그룹 검정
윌콕슨의 부호 순위 검정

 

4. (독립) 세 그룹 이상 검정
클루스칼-왈라스 검정

 

5. (대응) 세 그룹 이상 검정
프리드만 검정
켄달 W 검정

728x90

23.1 χ2-검정이란 ?    https://rsas.tistory.com/121

23.2 설문지 분석 - χ2 검정  https://rsas.tistory.com/214

23.3 χ2-검정의 이론적 배경

23.3.1 독립성 검정(independence test)

23.3.2 적합도 검정(goodness of fit test)

23.3.3 기타 통계량

23.4 가중치를 고려한 카이제곱법

23.5 카이제곱법 적용 오류

23.5.1 Cell빈도수가 작은 경우 적용오류

23.5.2 카이제곱법을 잘못 적용한 경우

23.6 카이제곱법 기타 이슈

23.6.1 복수 응답인 경우

23.6.2 Missing 처리

23.6.3 항목 합치기

23.6.4 카이제곱검정과 분산분석법 선택

23.7 카이제곱 분포표 만들기 CINV( ) 함수 이용

23.8 PROC FREQ의 형태

23.9 R 프로그램 카이제곱검정

 

χ2(카이제곱이라 읽는다)검정은 명목변인들간의 상호관련성 여부에 관한 검정을 행하는 통계기법입니다. 

예를 들면 남녀별로 취미생활에 대한 차이가 있는지를 보고자 할 때 사용하는 방법입니다. 

일반 설문조사의 90% 이상이 χ2검정의 적용을 필요로 합니.

 

+ Recent posts