=================================================================
예전에 회귀분석이 통계학의 꽃이라는 얘기를 하곤 했습니다.
통계학 수업에서 회귀분석을 마치면 기초통계학을 다 배우게 되는 셈입니다.
회귀분석 바로 다음으로 로지스틱회귀분석이 나타나지만 그건 기초통계학의 범위를 벗어납니다.
회귀분석의 결과물을 보면
t검정(회귀계수 검정시)
F검정(회귀모형의 타당성 검정시)
다중공선성, 스텝와이즈 등 여러 이슈를 다루고 있습니다.
예전에는 로지스틱회귀분석이라 하면 회귀분석의 특수한 경우인 종속변수가 0 또는 1 같은
값을 가질 때 다루는 기법으로만 설명했습니다.
그러다가 머신러닝 분야에 들어오면서, 분류기법들이 주목을 받게 되면서
로지스틱회귀분석이 통계학에서 머신러닝으로 넘어가는 징검다리 역할을 하게 되었습니다.
===================================================================
회귀분석이란 변수 상호간의 관계를 표본으로부터 추정하는 방법입니다.
간단히 말해 키(hei)와 몸무게(wei) 두 변수의 자료가 있는 경우
wei= -45.056 + 0.644 * hei 등의 형태와 같은 X, Y의 관계식을 구하는 기법이라고 생각하면 됩니다.
y= aX+b 와 같이 독립변수의 개수가 1개인 경우를 단순회귀분석이라고 하고,
독립변수의 개수가 2개 이상인 경우에는 다중회귀분석이라고 합니다.
다음은 키(hei), 몸무게(wei) 그리고 나이(age) 에 대한 6개의 데이터입니다. 이 6개의 데이터의 관계를 가장 잘 설명하는 식을 구해 봅니다.
* PROC REG의 간단한 형태 – 제21강_회귀분석.sas;
DATA a1;
INPUT gender $ wei hei age;
CARDS;
F 65 171 23
F 66 172 24
F 69 176 38
M 67 173 43
M 68 177 40
M 72 178 42
;
PROC REG;MODEL wei=hei;
RUN;
PROC REG;MODEL wei=hei age;
RUN;
'SAS강좌와 통계컨설팅 - 통계편 > 23. 회귀분석' 카테고리의 다른 글
(S)제21강(13)_회귀분석에서 더미변수 다루기(SAS) (0) | 2021.12.21 |
---|---|
(P)제21강(16)_파이썬으로 하는 다중회귀분석 실습 - statsmodels (0) | 2021.12.21 |
(P)제21강(16)회귀분석 실습(python) - sklearn-LinearRegression (0) | 2021.12.21 |
(R)제21강(16) R로 하는 회귀분석 실습 - mtcars 데이터 (0) | 2021.12.21 |
(R)제21강(16)_회귀분석 실습 :R 프로그램 (0) | 2021.12.21 |