boot2 (R1)제01강(04) 모형성능평가 - 붓스트랩 Bootstrap 붓스트랩(Bootstrap) 1979년: 미국 Stanforrd 대학교, 브래들리 에프런 (Bradley Efron) 교수 1977년 창안, 붓스트랩 소개 그 후 붓스트랩은 현재 통계학에서는 없어서는 안 될 중요한 주제라고... 붓스트랩은 원 데이터 (개수n)에서 랜덤으로 추출하는데, 복원 추출하여 (... 데이터가 중복되는 것을 허락) 원래의 데이터 개수n만큼 추출하여 분석하는 방법입니다. 일반적으로 표준오차(평균의 표준편차)를 구하는 방법을 다음과 같습니다. 원 데이터에서 표준편차를 구하고(쉽게 구할 수 있습니다) 이 표준편차/ (데이터 갯수의 제곱근) 으로 구합니다. set.seed(12345) norm_x 2022. 1. 6. (R1)제01강(05)_모형성능평가 : LOOCV, k-fold 실습 주어진 데이터(예를 들어 mtcars) 에서 잘 맞는 회귀모형을 구하거나, 회귀모형이 얼마나 잘 맞는지를 보려면 데이터셋을 train 데이터와 test 데이터로 구분하여 train 데이터에서 모형(회귀모형등)을 구하고 이를 test 데이터 적용하고, 얼마나 잘 맞는지 지표로서 MSE(Mean Squared Error)을 한 번 구해 보았습니다. 그런데 이러한 작업을 여러 번 해 보려면 어떻게 할까? (1) 데이터(관측치수 n개)dptj 관측치 1개를 제외하고 (2) n-1개의 관측치를 가지고 모형(회귀분석)을 구하고 (3) 이를 test 데이터(이는 관측치 1개뿐) 적용하여 예측치(이것도 1개)를 구합니다. (4) 이번에는 2번째 관측치를 제외하고, 위와 같은 방법으로 작업을 진행합니다. (5) 이러기를.. 2021. 12. 30. 이전 1 다음