공공기관을 방문하면 관련 데이터를 다운로드할 수 있는데
SAS, SPSS 데이터가 종종 보입니다.
물론 엑셀 데이터로 다운로드 받을 수도 있게 되어 있습니다.
SAS, SPSS 형태로 데이터를 다운로드하게 하는 것은
파일만 다운로드 받으면 변수에 대한 정보들을 곧장 이용할 수 있기 때문입니다.
엑셀 특히 csv 파일로 되어 있지만 열어보기 쉽지만, 각 필드에 대한 정보는
별도로 제공하는 레이아웃을 보고, 전처리 등을 거쳐야 합니다.
SAS는 확장자가 sas7 bdat로 되어 있고
SPSS는 확장자가 sav 파일로 되어 있습니다.
PC에 SAS 나 SPSS 가 설치되어 있으면 다운로드한 파일을 더블클릭하면
자동적으로 해당파일이 열리는 것을 볼 수 있습니다. 그래서 그다음은... 막막
SAS의 경우
1. 나의 PC에 폴더를 하나 만듭니다. 예. d:\sas_class
2. 새로 만든 폴더(d:\sas_class)에 다운로드 받은 SAS파일(확장자 sas.7bdat)를 복사합니다.\
3. SAS 프로그램을 만듭니다. 라이브러리를 이용합니다.(라이브러리란 것은 방금 만든 d:\sas_class 폴더에
대한 별명이라고 생각하시면 됩니다.
LIBNAME kkk "d:\sas_class\' ; * 여기서 kkk 는 각자 마음대로 줘도 됩니다.
DATA a1;SET kkk.health;
* kkk.health 에서 kkk. 은 나의 PC의 d:\sas_class 폴더를 가리키고
* kkk. 뒤에 있는 health 는 다운로드한 데이터 health.sas7 bdat를 가리킵니다.
... [SAS 프로그램]
;
이렇게 하면 됩니다.
엑셀파일인 경우에는 PROC IMPORT를 사용하면 되고
텍스트 파일인 경우에는 INFILE 문을 사용하면 됩니다.
SAS가 없으면 어떻게 하나요? R을 이용하면 됩니다.
R에서 패키지 sas7bdat 를 이용
install.packages("sas7bdat")
library(sas7bdat)
setwd("d:/sas_class")
a1 <- read.sas7bdat(health.sas7bdat)
str(a1)
* 궁금한 부분이 있으시면 댓글을 남겨 주세요
제가 아는 범위내에서 답변드리겠습니다.
'SAS연습 200제 > 3. 외부파일다루기' 카테고리의 다른 글
(S,R)제04강(09)인터넷으로 iris 데이터 불러오기 (0) | 2021.12.13 |
---|---|
(P)제05강(09)_UCI Irvine Machine Learning Reposi.. 이용 (0) | 2021.12.13 |
(P)제05강_손글씨 파일 읽어오기 - sklearn, MNIST (0) | 2020.12.18 |
(P)제05강_파이썬으로 SAS 파일불러오기 (0) | 2020.12.14 |
(P)제05강_파이썬 iris 데이터 이용하기 (0) | 2020.12.14 |