728x90
파이썬으로 해 보는 t 검정입니다. 통계분석용으로 많이 사용되는 scipy 패키지를 이용합니다.
아나콘다를 설치하면 scipy가 자동으로 설치됩니다.
scipy 패키지에서 통계분석 모듈인 stats를 불러오고, 그중 독립적인 두 집단 검정인
ttest_ind를 이용합니다.
(참고적으로
SAS에서는 PROC TTEST;
R에서는 패키지 {stats}의 t.test( )를 이용합니다.)
이렇게 R과 파이썬을 사용하는 방법이 유사합니다. R은 통계분석용으로 많이 사용되고 있고 파이썬은 분석용 솔루션을 개발하는데 많이 사용됩니다. |
>>> from scipy.stats import ttest_ind # 패키지 scipy의 stats 모듈에서 ttest_ind함수를 불러옴 x1 = [60,66,72,78,84,80] # 두 그룹의 국어성적 데이터를 입력 x2 = [64,69,75,81,87,92] statistic, p_value = ttest_ind( # 독립적인 t검정을 위한 ttest_ind 함수의 인수를 지정 a=x1, b=x2,equal_var=True # 두 그룹의 분산이 같다는 가정 지정...variance equal. ) |
t 검정의 결과인 statistic과 p 값을 출력합니다.
print(f"statistic: {statistic:.5f}") print(f"p_value : {p_value:.5f}") |
statistic: -0.81428 p_value : 0.43444 |
Jupyter Notebook 을 이용하는 과정을 나타내는 그림
p 값(확률)이 0.43444 로 유의수준 0.05 보다 크므로 두 집단의 평균이 같다는 가설을 받아들입니다... (수정)
SAS 결과 - 두 그룹의 분산이 같으므로 Pooled 경우를 보면 p확률이 0.4344 로 파이썬의 결과와 같이 나오는 것을
볼 수 있습니다.
R결과 - p-value = 0. 4344 로 파이썬, SAS 의 결과가 같이 나오는 것을 볼 수 있습니다.
'SAS강좌와 통계컨설팅 - 통계편 > 20. t 검정' 카테고리의 다른 글
(S,R)제18강(01)_t 검정이란 (0) | 2021.12.18 |
---|