본문 바로가기

SAS강좌와 통계컨설팅 - 통계편58

(P)제24강(01)_상관분석 실습 - Python-Numpy 프로그램 파이썬에서 상관계수와 공분산을 구하는 예제입니다 # 넘파이로 하는 상관분석 import numpy as np # numpy 를 불러옴 gender=["F","F","F","M","M","M"] wei = [65,66,69,67,68,72] hei = [171,172,176,173,177,178] age=[23,24,38,43,40,42] # 표본상관계수를 구하기 위해 numpy의 corrcoef() 를 이용 np.corrcoef(wei,hei) # 공분산 구하기 np.cov(wei,hei) 2021. 12. 20.
(S)제20강(02)_상관분석실습 - mtcars 데이터 변수가 많은 경우 상관분석을 하는 실습을 하고, 설문지에서 상관분석 하는 실습을 합니다. 실습데이터는 R설치할 때 기본적으로 설치되는 datasets 패키지에 들어있는 mtcars를 이용합니다. * 상관분석의 예제 구하는 프로그램; 1 DATA mtcars;INFILE 'd:\sas_class\mtcars.txt'; 2 INPUT mpg cyl disp hp drat wt qsec vs an gear carb; 3 PROC CORR; 4 PROC CORR NOSIMPLE RANK PLOT=MARIX; 5 VAR mpg cyl disp hp drat wt qsec vs an gear carb; 6 RUN; 3 PROC CORR;의 결과 단순기술통계량과 상관계수를 프린트합니다. 1 차원의 비교입니다. VAR.. 2021. 12. 20.
(S)제20강(01)_상관분석이란? 상관분석은 두 변수간의 (선형)상관관계를 분석하는 기법입니다. 일반적으로󰡒상관관계󰡓라는 말과󰡒상관계수󰡓라는 말을 너무 혼동하여 사용하고 있습니다. 예를 들어 "업무의 만족도와 성별의 상관 관계를 보고 싶다."라는 말은 "남녀별 업무의 만족도에 대한 차이가 있는가?" 즉 "t-검정을 실행하겠다."라는 의미이지 성별을 나타내는 변수와 업무만족도를 나타내는 변수의 상관계수를 구한다는 의미는 아닙니다. 문항에 따라 카이제곱법을 할 수도 있고 회귀분석을 행할 수도 있습니다. 여기서 말하는 상관계수는 두 「연속변수」의 「선형관계」의 정도를 나타내는 척도입니다. 상관계수는 연속형 변수인 경우에 의미가 있으며, 상관계수는 단지 두 변수의 선형(linear)관계의 정도만을 나타내기 때문에 2차, 3차 관계가 있는데도 불.. 2021. 12. 20.
(S)제20강(00)_상관분석 : 목차, 역사 제20강. 상관분석 목차 20.1 상관분석이란? 20.2 엑셀로 하는 상관분석 20.3 상관분석 실습 20.3.1 상관분석 실습 – mtacrs 데이터 20.3.2 상관분석 실습 – 설문지 분석 20.4 상관분석 이론적 배경 20.5 상관분석 결과를 저장하기 - OUTP 옵션 20.6 편상관계수(Partial Correlation) 20.6.1 편상관계수란? 20.7 상관분석의 기타 논제 20.7.1 앤스컴(anscombe) 예제 20.7.2 비모수 상관계수 20.7.3 상관계수 기타 고려사항 20.8 정준상관분석 20.9 PROC CORR의 형태 20.10 R 프로그램 – 상관분석 (1) 상관분석의 역사 칼 피어선(Karl Pearson, 1857~1936) 수리통계학의 기초를 다진 영국의 수학자 영국.. 2021. 12. 20.
(S)졔16강(01)_분산에 대한 분석: 카이제곱법 “15강. 평균에 대한 분석”에서 설명할 때 모평균에 대한 구간추정은 (1) 표본으로부터 평균값을 계산하고 (2) 이 표본평균값의 분포인 정규분포 또는 t분포를 이용하여 (3) 모집단의 평균에 대한 구간을 추정하였습니다. 이제 모분산에 대한 구간추정에 대하여 살펴보기로 하겠습니다 모분산의 구간추정의 경우에도 (1) 표본으로부터 표본분산을 계산하고, (2) 표본분산의 분포인 카이제곱분포를 이용하여 (3) 모집단의 분산에 대한 구간을 추정합니다. 평균이 $ u $이고 표준편차가 $ \sigma ^2 $ 인 정규분포를 하는 모집단에서 크기가 인 표본을 추출하였을 때 표본으로부터 구한 표본분산은 모분산의 점추정량이 되며 그 형태는 다음과 같습니다 $ \\ $ $\\ s^2=\frac{\sum(x_i-\bar{x.. 2021. 12. 20.
(S)제16강(02)_카이제곱분포 그리기 분산의 분포와 관련된 카이제곱분포의 형태는 비대칭이며 오른쪽 꼬리가 긴 형태를 갖고 있으며 자유도에 따라 그 형태가 다릅니다. 1. 오른쪽꼬리를 갖는 비대칭형 연속분포이며 항상 양수 값만을 가진다. 2. (표본의 크기에 따라 결정되는) 자유도에 따라 모양이 변하는데 자유도는 표본의 크기에서 1을 뺀 값이다. 3. 자유도가 크면 클수록 정규분포에 가까워진다. /*----------------------------------------------------*/ /* 카이제곱분포 그림구하기; /*----------------------------------------------------*/ 1 DATA a1; 2 DO x=0 TO 30 BY 1; 3 df1=5; 4 df2=7; 5 df3=10; 6 df4=.. 2021. 12. 19.