SAS강좌와 통계컨설팅 - 통계편58 (R1)제19강(1.1) 분산분석법(ANOVA)이란 분산분석법은 세 그룹 이상의 평균값이 차이가 있는가?를 분석하는 기법입니다. 두 그룹의 평균값의 차이가 있는가?를 분석할 때에는 t검정을 사용합니다. 분석분석법 가정 (1) 각 그룹별 정규분포를 따라야 된다... (2) 분산이 같아야 한다... (3) 물론 각 그룹 데이터가 각각의 모집단에서 독립적이다... 분산분석법의 가정을 먼저 점검해야 함에도, 당연한 것으로 생각하고, 실생활에서는 거의 체크를 하지 않았습니다. 다시금 생각을 해 봅니다. 각 그룹별로 정규분포를 따르지 않으면... 어떡하나? 각 그룹별로 분산이 같아야 하나? 같지 않으면... 빅데이터 시대에는 데이터가 많으니 정규분포를 따지는 것은 별 의미가 없는 것 아닌가? 빅데이터... 빅데이터.. 하지만 그건 Social 분야 또는 제조공정 분.. 2020. 12. 7. (P)제21강(01) 파이썬으로 하는 회귀분석 - from scipy import stats R에서 하던 회귀분석을 파이썬으로 해 본 것입니다. from scipy import stats # R에서 library(stats) 와 같이 라이브러리 scipy에서 stats 모듈을 로딩 wei = [65,66,69,67,68,72] # R에서 벡터 wei 2020. 11. 24. (R2)제03강(1.0) 정규분포 검정 - Shapiro-Wilk Test 거의 모든 통계기법들을 보면 "정규분포"를 따를 때, "정규분포를 따른다고 가정하면" 이란 말들이 참 많이 나옵니다. 도대체 정규분포가 뭐길래... 물론 고등학교 때부터 배워 온 단어이기는 하지만... 일단 데이터가 있으면 정규분포를 따르는지를 검정하여 보기로 하겠습니다. 여기에는 샤피로 월크 검정이 사용됩니다. 샤피로 윌크 검정 샤피로 윌크 검정(Shapiro-Wilk Test)은 표본이 정규 분포로부터 추출된 것인지 테스트하기 위한 방법입니다. 검정은 R을 설치할 때 기본적으로 설치되는 {stats} 패키지의 shapiro.test( ) 함수를 사용하는데, 이때 귀무가설은 "주어진 데이터가 정규 분포로부터의 표본이다"라는 것입니다. ?shapiro.test #shapiro.test()함수 도움말 # .. 2020. 11. 19. (P)제29강(01)_시계열분석 실습: 파이썬 R과 SAS에서 실행한 시계열분석 실습을 이번에는 Python 으로 해 봅니다. 계속 보완해 나갈 계획입니다 ^^^ 그냥 단순한 60개의 데이터입니다. 향후 10개의 데이터를 예측해 보기로 합니다. 644 546 515 506 468 729 719 626 677 679 654 630 662 539 419 592 376 390 292 340 457 254 368 376 254 85 198 212 262 368 554 538 478 623 522 404 360 619 524 562 438 327 311 466 423 515 367 340 279 264 411 409 436 468 409 275 265 301 423 405 384 557 474 519 459 504 349 312 303 423 384 425 .. 2020. 10. 29. 제19강(5.1) 반복측정분산 분석(수정중) 분산분석법: 정규성 & 등분산성 정규성: 관측치의 수가 거의 비슷하면 어느 정도 양해 등분산성: 분산분석법에서는 그룹마다 등분산성 가정... 구형성 sphericity assumption 반복측정에서는 그룹내 상관관계가 있음 구형성 sphericity assumption 여러 시점에 걸쳐 반복 측정이 되는데, 이 들 각 시점마다 측정치의 차이 분산이 일정하다. 가까운 시점의 측정치들이 다른 시점에 비해 상관관계가 높다면 구형성 가정이 위배 구형성 검정법: Mauchly's Test 구형성이 아닌 경우: Greenhous-Geisser, Huynh-Feldt 제안한 수정된 검정통계량 이용 시간에 따른 분석 분산분석볍 개념 = 그룹간 제곱합(평균) / 그룹내 제곱합(평균) 반복측정 분산분석법 개념 그룹내 제.. 2020. 9. 5. (R2)제11강(2.1) χ2-검정의 이론적 배경(r2,s2) "왜 χ2 검정을 적용하느냐?"에 대한 무책임 하면서도 가장 정확한 답변은 "해당 통계치가 χ2 분포를 따르기 때문이다."입니다. $$\chi^2 =\sum_i \sum_j (\frac{O_{ij} – E_{ij})^2}{E_ij}$$ 은 자유도 (n1-1) X (n2-1) 인 χ2 분포를 합니다. *** 제가 젊은 시절 처음 통계분석 컨설팅을 하게 되면서 궁금해 했던 부분입니다. 성별*취미생활 분석을 할 때 왜 비모수검정 기법인 카이제곱검정을 적용하는지 궁금했습니다. 카이제곱분포는 비모수적 분포가 아니고, 분산에 관한 모수적 분포라고 배웠습니다. 카이제곱분포는 분산을 분석할 떄 사용되는 분포이고, 카이제곱분포를 따르는 변수 2개를 서로 분모, 분자에 두고 나누면 F 분포를 따른다고 배웠는데 이렇게 분산.. 2020. 7. 24. 이전 1 ··· 6 7 8 9 10 다음