728x90

=================================================================

예전에 회귀분석이 통계학의 꽃이라는 얘기를 하곤 했습니다.

통계학 수업에서 회귀분석을 마치면 기초통계학을 다 배우게 되는 셈입니다.

회귀분석 바로 다음으로 로지스틱회귀분석이 나타나지만 그건 기초통계학의 범위를 벗어납니다.

회귀분석의 결과물을 보면

t검정(회귀계수 검정시)

F검정(회귀모형의 타당성 검정시)

다중공선성, 스텝와이즈 등 여러 이슈를 다루고 있습니다.

예전에는 로지스틱회귀분석이라 하면 회귀분석의 특수한 경우인 종속변수가 0 또는 1 같은

값을 가질 때 다루는 기법으로만 설명했습니다.

그러다가 머신러닝 분야에 들어오면서, 분류기법들이 주목을 받게 되면서

로지스틱회귀분석이 통계학에서 머신러닝으로 넘어가는 징검다리 역할을 하게 되었습니다.

===================================================================

 

회귀분석이란 변수 호간의 관계를 표본으로부터 추정하는 방법입니다.

간단히 말해 키(hei)와 몸무게(wei) 두 변수의 자료가 있는 경우

wei= -45.056 + 0.644 * hei 등의 형태와 같은 X, Y의 관계식을 구하는 기법이라고 생각하면 됩니다.

y= aX+b 와 같이 독립변수의 개수가 1개인 경우를 단순회귀분석이라고 하고,

독립변수의 개수가 2개 이상인 경우에는 다중회귀분석이라고 합니다.

다음은 키(hei), 몸무게(wei) 그리고 나이(age) 에 대한 6개의 데이터입니다. 6개의 데이터의 관계를 가장 잘 설명하는 식을 구해 봅니다.

 

* PROC REG의 간단한 형태 21_회귀분석.sas;

DATA a1;

INPUT gender $ wei hei age;

CARDS;

F 65 171 23

F 66 172 24

F 69 176 38

M 67 173 43

M 68 177 40

M 72 178 42

;

PROC REG;MODEL wei=hei;

RUN;

PROC REG;MODEL wei=hei age;

RUN;

s_reg_reg_01

 

s_reg_reg_02

+ Recent posts