728x90

파이썬으로 해 보는 t 검정입니다. 통계분석용으로 많이 사용되는 scipy 패키지를 이용합니다.

아나콘다를 설치하면 scipy가 자동으로 설치됩니다.

scipy 패키지에서 통계분석 모듈인 stats를 불러오고, 그중 독립적인 두 집단 검정인

ttest_ind를 이용합니다.

(참고적으로

SAS에서는 PROC TTEST;

R에서는 패키지 {stats}의 t.test( )를 이용합니다.)

 

이렇게 R과 파이썬을 사용하는 방법이 유사합니다.
R은 통계분석용으로 많이 사용되고 있고
파이썬은 분석용 솔루션을 개발하는데 많이 사용됩니다.

 

>>> from scipy.stats import ttest_ind    # 패키지 scipy의 stats 모듈에서 ttest_ind함수를 불러옴
x1 = [60,66,72,78,84,80]                      # 두 그룹의 국어성적 데이터를 입력
x2 = [64,69,75,81,87,92]
statistic, p_value = ttest_ind(                # 독립적인 t검정을 위한 ttest_ind 함수의 인수를 지정     
a=x1,
b=x2,equal_var=True                       # 두 그룹의 분산이 같다는 가정 지정...variance equal.
)

 

t 검정의 결과인 statistic과 p 값을 출력합니다.

print(f"statistic: {statistic:.5f}")
print(f"p_value : {p_value:.5f}")

 

statistic: -0.81428
p_value : 0.43444

 

Jupyter Notebook 을 이용하는 과정을 나타내는 그림

p 값(확률)이 0.43444 로 유의수준 0.05 보다 크므로 두 집단의 평균이 같다는 가설을 받아들입니다... (수정)

 

SAS 결과 - 두 그룹의 분산이 같으므로 Pooled 경우를 보면 p확률이 0.4344 로 파이썬의 결과와 같이 나오는 것을 

볼 수 있습니다.

 

R결과 - p-value = 0. 4344 로 파이썬, SAS 의 결과가 같이 나오는 것을 볼 수 있습니다.

'SAS, R, Python 일반 > 18. t 검정' 카테고리의 다른 글

(S,R)제18강(01)_t 검정이란  (0) 2021.12.18

+ Recent posts