728x90

공공기관을 방문하면 관련 데이터를 다운로드할 수 있는데

SAS, SPSS 데이터가 종종 보입니다.

물론 엑셀 데이터로 다운로드 받을 수도 있게 되어 있습니다.

SAS, SPSS 형태로 데이터를 다운로드하게 하는 것은

파일만 다운로드 받으면 변수에 대한 정보들을 곧장 이용할 수 있기 때문입니다.

엑셀 특히 csv 파일로 되어 있지만 열어보기 쉽지만, 각 필드에 대한 정보는

별도로 제공하는 레이아웃을 보고, 전처리 등을 거쳐야 합니다.

 

SAS는 확장자가 sas7 bdat로 되어 있고

SPSS는 확장자가 sav 파일로 되어 있습니다.

PC에 SAS 나 SPSS 가 설치되어 있으면 다운로드한 파일을 더블클릭하면

자동적으로 해당파일이 열리는 것을 볼 수 있습니다. 그래서 그다음은... 막막

 

SAS의 경우

1. 나의 PC에 폴더를 하나 만듭니다.  예. d:\sas_class

2. 새로 만든 폴더(d:\sas_class)에 다운로드 받은 SAS파일(확장자 sas.7bdat)를 복사합니다.\

3. SAS 프로그램을 만듭니다. 라이브러리를 이용합니다.(라이브러리란 것은 방금 만든 d:\sas_class 폴더에 

대한 별명이라고 생각하시면 됩니다.

 

LIBNAME kkk "d:\sas_class\'   ; *  여기서 kkk 는 각자 마음대로 줘도 됩니다.

DATA a1;SET kkk.health;           

* kkk.health 에서 kkk. 은 나의 PC의 d:\sas_class 폴더를 가리키고

* kkk. 뒤에 있는 health 는 다운로드한 데이터 health.sas7 bdat를 가리킵니다.

... [SAS 프로그램]

 

이렇게 하면 됩니다.

엑셀파일인 경우에는 PROC IMPORT를 사용하면 되고

텍스트 파일인 경우에는 INFILE 문을 사용하면 됩니다.

SAS가 없으면 어떻게 하나요? R을 이용하면 됩니다.

R에서 패키지 sas7bdat 를 이용

install.packages("sas7bdat")

library(sas7bdat)

setwd("d:/sas_class")

a1 <- read.sas7bdat(health.sas7bdat)

str(a1)

 

* 궁금한 부분이 있으시면 댓글을 남겨 주세요

제가 아는 범위내에서 답변드리겠습니다.

+ Recent posts