본문 바로가기

통계컨설팅40

(S)제04강(00)_외부파일 이용하기(SAS) - 목차 이번 강의에서는 외부 파일을 읽어 들이는 방법에 대하여 알아보도록 하겠습니다. 보통 설문조사를 하게 되면 회수된 설문지를 입력할 때 엑셀을 많이 사용합니다. 그러나 수천 만 건 이상 되는 대용량 데이터의 경우에는 엑셀로는 한계가 있기 때문에 텍스트 형태를 많이 사용하게 됩니다. 이 때 각 변수들이 고정형식으로 일정 양식으로 입력되는 경우도 있지만, 디스크 공간을 많이 차지하기 때문에 변수 사이에 ‘|’ 이나 ‘,’ 때로는 탭(tabs)을 구분자(delimiter)로 사용하여 변수를 구분하기도 합니다. 또한 변수 값이 없는 경우 비워두거나 9999 등으로 표시하기도 합니다. 이렇게 다양한 형태로 된 데이터를 받았을 때 가장 먼저 해야 하는 일은 SAS로 읽어 들여 SAS 데이터셋을 만들어야 합니다. 평균값.. 2021. 12. 13.
(S)제04강(01)_텍스트파일 다루기(SAS) - INFILE 문 이번에는 SAS의 메뉴를 이용하지 않고 INFILE 문을 이용하여 외부에 있는 파일을 이용하는 방법을 설명합니다. FILENAME 문을 사용해도 되지만 주로 INFILE 문을 사용합니다. /* ----------------------------------------------*/ /* 외부 파일을 이용한 형태 – 04_infile.sas */ /* ----------------------------------------------*/ 1 DATA a1;INFILE 'd:\sas_class\04_sample.txt'; 2 INPUT gender $ hei wei; 3 health=(hei-100)*0.9-wei; 4 xlog=LOG(health); 5 PROC PRINT;VAR xlog hei wei; 6.. 2021. 12. 13.
표준화(standard) - SAS(standard), R(scale) =============================================== 수많은 단어들 중에 헷갈리는 단어들이 있습니다. 표준화(standardize)와 정규화(normalize), 릿지 regression(능형회귀분석)과 라소(Lasso) 회귀분석 등 ================================================ 표준화와 정규화 단어 중에서 먼저 표준화만 알면 됩니다... 표준이니까 우선 영어로 standard, 표준화는 standardise 표준이니까 일단 평균을 빼고, 표준편차로 나누는 것.. $$z= \frac{x- \bar{X}} {\sigma }$$ [SAS] DATA a1; INPUT gender $ wei hei age; CARDS; F 65 171 2.. 2021. 11. 25.
제19강(1.0)분산분석법 목차 1 분산분석법(ANOVA)이란 ? 2 설문지 분석 - 분산분석법 3 일원분산분석법 3.1 일원분산분석법의 이론적 배경 3.2 일원분산분석법 실습 4 이원분산분석법 4.1 이원분산분석법의 이론적 배경 4.2 이원분산분석법 실습 4.3 다중비교 4.4 이원분산분석법 - 교호작용이 있는 경우 5 난괴법(Randomized Block Design) 6 분산분석법의 기타 논제 6.1 t-검정과의 비교 6.2 비모수 분산분석법 – 클루스칼-왈리스 검정 7 PROC ANOVA의 형태 8 R 프로그램 – 분산분석법 (1) F 분포의 역사 F-분포는 통계학에서 널리 사용되는 분포로서, 이를 이용한 F-검증은 피셔(Ronald Aylmer Fisher)에 의해 고안되었고, 스네데커(Snedecor)에 의해 F-검정이라고 .. 2021. 6. 19.
제01강(3.2) SAS University Edition - 지원 중단 !!! (S1)제15강(1.0) SAS University Edition 설치하기 - 지원중단 !!! SAS 무료버전이 중단되고 대신 SAS 클라우드 버전인 SAS OnDemand for Academics가 서비스가 제공되고 있습니다. SAS 무료 버전인 SAS University Edition(이하 SAS-UE)에 대하여 설명합니다. SAS-UE는 대학교에서 교수나 학생들이 비상업적인 목적으로 SAS 교육이나 학습을 위해 무료로 사용할 수 있는 제품입니다. SAS-UE 는 Windows, 맥 OS, 리눅스에서도 사용할 수 있으며 일반인들이 많이 사용하고 있는 Windows의 경우, 64-bit CPU 프로세서와 최소 1GB 메모리가 필요합니다. SAS-UE는 가상 서버에서 실행이 되므로 먼저 가상 머신(Vir.. 2021. 6. 19.
표본분산을 구할 때 (n-1)로 나누는 이유 $ \text{표본분산을 구할 때 n으로 나누지 않고 n-1로 나누는 이유를 설명합니다.} $ $ \\ $ $ s^2 = \frac{ \sum_{i=1}^n (x_i-\overline{x})^2} {n-1} $\begin{align*} E[s_n^2] &=E[\frac{1}{n} \sum_{i=1}^n(xi- \overline{x})^2]\\ &=\frac{1}{n} E[\sum_{i=1}^n ((x_i-u)-(\overline{x}-u))^2]\\ &=\frac{1}{n} E[\sum_{i=1}^n ( (x_i-u)^2- 2(x_i-u)(\overline{x}-u)+(\overline{x}-u)^2)]\\ &=\frac{1}{n} E[\sum_{i=1}^n ( x_i-u)^2- 2(\overline{x.. 2021. 4. 8.