728x90

통계분석을 하려면

(1) 우선 데이터가 있어야 하고

(2) 분석하고자 하는 목적(또는 연구목적)  이 있어야 하고

    심지어 그냥, 한 번 해 보고 싶어서... 경험 삼아... 등

(3) 분석 목적에 맞는 분석 통계기법으로 어떤 기법이 적당한지 알아야 되고

(4) 기법을 사용하여 분석하고, 결론 도출하는 과정을 거치면 됩니다.

 

쉬운 것 같이 보이지만, 한 단계, 한 단계 엄청 만만치 않습니다. 

그래도 한 번 해 보는 것이 통계학을 이해하고, 실전에 적용하는데 매우 도움이 됩니다.

 

통계분석 패키지 - SPSS, SAS, R

통계 분석하려면 통계분석용 소프트웨어가 있어야 합니다. 물론 엑셀에서도 통계분석 기능이 있습니다.

 

(1) SPSS

우선 가장 편안하고 많이 사용되는 패키지로는 SPSS 를 들 수 있습니다.
SPSS는 주로  메뉴 방식으로(엑셀과 같이) 많은 것을 해결할 수 있어 편리합니다.

SPSS도 명령어(Syntax) 방식으로 사용 가능합니다.

 

(2) SAS

통계분석용을 시작한 SAS는 주로 명령어 방식이므로  SAS 명령어를 익혀야 하는 부담이 있습니다.

(SAS도 메뉴 방식이 있습니다). SAS는 여러 개의 제품(또는 솔루션)으로 구성되어 있으며 가격이 비싼 것이 단점입니다. 

SAS는 처음에는 통계분석용으로 시작했지만, 지금은 거의 분야 Machine Learning 등에도 많은 솔루션이 있습니다.

 

(3) R

요즘 R이 대세입니다. R은 무료이고, 그 기능이 강력합니다. 관련 자료도 엄청 많습니다.

다만 R 을 익혀야 합니다. 처음에는 R이 쉽지만, 점차 공부해야 할 부분이 많은 것이 장점이기도 하고 단점(?) 이기도 합니다.

 

(4) Python

파이썬도 R과 비교하여 통계분석용으로 설명되기는 하지만, 파이썬은 개발용이지, 통계분석용 패키지는 아닙니다.

 

SAS와 R 비교(통계분석 분야 국한하여)

(1) SAS로 할 수 있는 통계분석은 거의 R로도 가능합니다.

 

(2) SAS 의 가장 큰 장점인 중간 결과를 OUTPUT 을 저장하여 같은 프로그램내에서도
    중간결과를 사용할 수 있는 점입니다. 이와 관련하여 R은 이 기능을 기본으로 제공하는 형태입니다.

 

(3) SAS는 DATA 문과 PROC 문으로 구성되어 있는데 해당 분석은 각 프로시져(PROC)로 해결하고

    R에서는 패키지안에 들어 있는 함수를 사용합니다. 예. chisq.test( )를 사용하면 됩니다.

  

(4) R 설치
    R은 무료이고, 10분 정도면 설치 가능합니다.(R과 RStudio 설치, 설치하는데 각각 5분 정도 소요)

    몇 줄만 입력하면 결과를 볼 수 있습니다.

   


(5) R 과 SAS 의 결과 비교
    SAS와 R 결과를 비교해 보는 것도 R을 익히는데 도움이 될 겁니다.

 

+ Recent posts