본문 바로가기

boot2

(R1)제01강(04) 모형성능평가 - 붓스트랩 Bootstrap 붓스트랩(Bootstrap) 1979년: 미국 Stanforrd 대학교, 브래들리 에프런 (Bradley Efron) 교수 1977년 창안, 붓스트랩 소개 그 후 붓스트랩은 현재 통계학에서는 없어서는 안 될 중요한 주제라고... 붓스트랩은 원 데이터 (개수n)에서 랜덤으로 추출하는데, 복원 추출하여 (... 데이터가 중복되는 것을 허락) 원래의 데이터 개수n만큼 추출하여 분석하는 방법입니다. 일반적으로 표준오차(평균의 표준편차)를 구하는 방법을 다음과 같습니다. 원 데이터에서 표준편차를 구하고(쉽게 구할 수 있습니다) 이 표준편차/ (데이터 갯수의 제곱근) 으로 구합니다. set.seed(12345) norm_x 2022. 1. 6.
(R1)제01강(05)_모형성능평가 : LOOCV, k-fold 실습 주어진 데이터(예를 들어 mtcars) 에서 잘 맞는 회귀모형을 구하거나, 회귀모형이 얼마나 잘 맞는지를 보려면 데이터셋을 train 데이터와 test 데이터로 구분하여 train 데이터에서 모형(회귀모형등)을 구하고 이를 test 데이터 적용하고, 얼마나 잘 맞는지 지표로서 MSE(Mean Squared Error)을 한 번 구해 보았습니다. 그런데 이러한 작업을 여러 번 해 보려면 어떻게 할까? (1) 데이터(관측치수 n개)dptj 관측치 1개를 제외하고 (2) n-1개의 관측치를 가지고 모형(회귀분석)을 구하고 (3) 이를 test 데이터(이는 관측치 1개뿐) 적용하여 예측치(이것도 1개)를 구합니다. (4) 이번에는 2번째 관측치를 제외하고, 위와 같은 방법으로 작업을 진행합니다. (5) 이러기를.. 2021. 12. 30.