728x90

예전에는 로지스틱회귀분석회귀분석의 특수한 형태로 종속변수가 0 또는 1을 가질 때에

적용하는 분석기법 정도로 설명을 하곤 했습니다.

그러다가 머신러닝 분야가 관심을 갖게 되면서 로지스틱 회귀분석이 많은 관심을 갖게 되고

통계학에서 머신러닝으로 넘어가는 징검다리의 역할을 하게 됩니다.

 

로지스틱회귀분석에서 나오는 몇가지 용어를 알아야 합니다.

오즈, 오즈비, 로짓, 로지스틱회귀모형 등입니다.

 

오즈는 p/(1-p)  즉 성공할 확률이 실패할 확률의 몇 배인지를 나타내는 값입니다.

오즈값이 4이면 성공할 확률이 실패할 확률보다 4배인 것을 의미합니다.

 

오즈비(ratio) 는 말 그대로 오즈의 비율입니다. 그러니까 오즈값이 두개가 있으면

이 두 오즈값의 비율을 의미합니다.

어떤 사건이 A 조건하에서 발생할 확률이 B조건 하에서 발생할 확률에 비하여

얼마나 더 큰가를 나타내는 값입니다.

* 간혹 오즈(p/(1-p)가 비율의 형태를 띄고 있어서, 오즈를 오즈비로 혼동하여

사용하는데 유의하시기 바랍니다.

 

로짓(Logit) : 로그 오즈

$$ 0 \lt p \lt 1$$

확률은 0 보다 크고 1보다 작다...

 

$$ 0 \lt \frac{p}{1-p} \lt \infty $$

p/(1-p) 는 0 보다 크고 무한대 보다 작다.

 

$$ -\infty \lt ln\frac{p}{1-p} \lt \infty $$

P/(1-p) 에 로그를 취하면 -무한대에서 +무한대까지의 값을 가진다.

 

다음이 바로 로지스틱 회귀모형입니다.

$$ln\frac{p}{1-p} = \alpha + \beta x $$

이제 회귀분석의 식을 대입할 수 있습니다. 

이것이 로지스틱 회귀분석의 흐름입니다...

+ Recent posts