본문 바로가기

통계컨설팅40

(S,R)제25강(02)_주성분분석 실습 - SAS와 R 비교 주성분분석을 R과 SAS를 비교해 보았습니다. SAS는 무료제품인 SAS University Edition 을 사용하였습니다. SAS UE는 상업용으로는 사용할 수 없습니다. 데이터는 변수가 2개(x1, x2)로 구성된 8개의 관측치입니다. 예전의 "SAS강좌와 통계컨설팅"에서는 10개의 데이터 였는데 8개로 줄였습니다. SAS에서는 PROC PRINCOMP 프로시져를 이용하였고 R에서는 패키지 {stats}의 princomp함수를 이용하였습니다. 결과는 동일하게 나왔습니다. * 주성분분석 실행하는 SAS 프로그램; DATA a1;INPUT x1 x2 @@;CARDS; 4 15 6 16 7 11 8 10 9 6 11 8 12 10 13 14 ; PROC PRINCOMP ;VAR x1 x2;RUN; PRO.. 2021. 12. 24.
(S)제25강(00)_주성분분석 목차 25.1 주성분분석이란? 25.2 주성분분석 실습 25.3 주성분분석의 이론적 배경 25.3.1 선형결합과 설명력 25.3.2 제1 주성분과 제2 주성분 25.3.3 고유치(Eigenvalue) 25.4 주성분 구하는 공식 25.5 주성분 점수 구하기 25.6 주성분 개수의 결정 25.7 상관행렬을 이용한 주성분분석 25.7.1 상관행렬을 구하고 분석하기 25.7.2 상관행렬 직접 이용하기 25.8 분석결과를 데이터셋으로 저장하기 25.9 주성분분석 예제 – USArrests 데이터 25.10 PROC PRINCOMP의 형태 25.11 R 프로그램 – 주성분분석 2021. 12. 24.
(S)제24강(03)_두 집단 쌍체비교 - 윌콕선 부호 순위 검정 그 그룹이 서로 짝을 이루는 경우에 두 그룹의 평균치 차이가 있는지를 검정하는 비모수적 검정 방법을 윌콕슨 부호순위 검정(Sign rank test) 라고 합니다. 모수적기법의 쌍체비교 t검정에 해당됩니다. 윌콕슨 부호순위 검정(Signed-rank Test)는 하나의 표본에서 특정값을 기준으로 하여 + 부호의 개수와 – 부호의 개수가 많은가? 적은가 또는 두 표본 간에 값의 차이에 대한 검정을 합니다. /*--------------------------------------------------------*/ /* 쌍체비교의 부호순위 검정 – */ /*--------------------------------------------------------*/ 1 DATA a;INPUT pre1 pre2; .. 2021. 12. 23.
제24강(02)_(독립)두 집단 분석 - 윌콕슨 순위합 검정 “제18강 t 검정”에서 “두 집단의 모평균의 차이가 있는가”를 분석하기 위해 모수적 통계분석 방법인 t 검정을 설명하였습니다. t검정에 대응하는 비모수적 방법으로 순위합(rank sum test) 검정이 있습니다. 윌콕선(Wilcoxon)의 순위합 검정과 맨-위트니(Mann-whitney)의 U검정은 동일하며 ‘맨-위트니-윌콕선 순위합 검정’ 이라고도 불립니다. 모수적 방법인 t 검정에서는 모집단이 정규분포를 따른다는 가정이 필요하고, 평균과 분산을 계산하지만 비모수적 방법에서는 모집단이 정규분포를 따른다는 가정도 필요하지 않고, 평균과 분산 등을 계산하지 않습니다. (1) 두 집단의 관측치를 통합하여 하나의 집단으로 구성한 다음, (2) 크기순으로 정렬하여 순서를 매긴 다음, (3) 두 집단의 순위에.. 2021. 12. 23.
(S)제24강(01)_비모수통계분석이란? 비모수 통계분석에 대한 생각... 통계학을 배우게 되면, 평균, 분산, 표준편차, 4분위수 등을 배우고 그런 다음 정규분포, t 분포, 카이제곱 분포, F 분포 등을 배우고 그런 다음 각종 통계 분석기법을 배웁니다. 그런 다음 비모수(?) 통계분석이란 다소 생소한 기법을 배우게 됩니다. 모수(?) 분석도 뭔지 잘 모르겠는데 거기에 "비"란 글자가 하나 더 붙은 비모수(?)... 비모수 분석은 "평균", "분산" 을 구하지 않고, t 검정이니, ANOAVA, 회귀분석이니 하는 것을 하지 않는 매우 쉬운 분석기법이라고 생각하시면 됩니다. 다시 설명하면 두 그룹 차이를 분석하려고 할 때, 두 그룹 각각 평균 (그러니까 숫자 2개)을 구하여 비교하는 t 검정 같은 것을 하지 않고 그냥 크기 순서대로 나열하여 어.. 2021. 12. 23.
(S)제22강(00)_로지스틱 회귀분석 목차 22.1 로지스틱 회귀분석이란? https://rsas.tistory.com/161 22.2 로지스틱 회귀분석의 이론적 배경 22.2.1 오즈(odds), 로짓(Logit) 그리고 시그모이드(sigmoid) 22.2.2 로지스틱 회귀분석 이론적 설명 22.2.3 로지스틱 함수 그리기 22.2.4 로지스틱 회귀분석 통계량 이해 22.2.5 PROC LOGISTIC과 로지스틱 회귀분석 유의할 점 22.3 로지스틱회귀분석을 이용한 분류 - 붓꽃데이터 22.3.1 로지스틱회귀분석을 이용한 분류 22.4 프로빗모형 22.5 PROC CATMOD, LOGISTIC과 PROBIT의 형태 22.5.1 PROC CATMOD 의 형태 22.5.2 PROC LOGISTIC 의 형태 22.5.3 PROC PROBIT의 형태 .. 2021. 12. 22.