728x90

이번 강의에서는 외부 파일을 읽어 들이는 방법에 대하여 알아보도록 하겠습니다. 보통 설문조사를 하게 되면 회수된 설문지를 입력할 때 엑셀을 많이 사용합니다. 그러나 수천 만 건 이상 되는 대용량 데이터의 경우에는 엑셀로는 한계가 있기 때문에 텍스트 형태를 많이 사용하게 됩니다.

이 때 각 변수들이 고정형식으로 일정 양식으로 입력되는 경우도 있지만, 디스크 공간을 많이 차지하기 때문에 변수 사이에 ‘|’ 이나 ‘,’ 때로는 탭(tabs)을 구분자(delimiter)로 사용하여 변수를 구분하기도 합니다. 또한 변수 값이 없는 경우 비워두거나 9999 등으로 표시하기도 합니다.

이렇게 다양한 형태로 된 데이터를 받았을 때 가장 먼저 해야 하는 일은 SAS로 읽어 들여 SAS 데이터셋을 만들어야 합니다. 평균값을 구하든 회귀분석을 하든지 하는 것은 그다음 문제입니다.

외부 데이터를 읽어 들이는 질문 중에는 엑셀을 어떻게 읽어 들이는가에 대한 문의가 제일 많습니다. 텍스트 형태의 데이터를 읽어 들이는 데 사용하는 "INFILE 문"을 엑셀데이터를 읽어 들일 때 사용하여 에러가 난다는 질문을 많이 합니다.

또한 분석 결과를 엑셀로 저장하거나 텍스트 파일로 저장할 때도 있고, SAS 작업 과정 중에 생긴 파일들을 다음에 사용할 수 있도록 저장하는 등 다양한 형태의 업무와 부딪히게 됩니다.

 

 

4.1. 텍스트파일 다루기 101

4.1.1. 텍스트파일 불러오기 메뉴 이용 101

4.1.2. 텍스트파일 불러오기 - INFILE 105

4.1.3. 텍스트파일로 저장하기 - FILE 문과 PUT 107

4.2. 엑셀파일 다루기 110

4.2.1. 엑셀파일 불러오기 - IMPORT 110

4.2.2. PROC IMPORT 의 형태 115

4.2.3. 엑셀파일로 저장하기 - EXPORT 117

4.2.4. PROC EXPORT의 형태 120

4.3. 구분자로 구분되어 있는 경우 121

4.3.1. 구분자가 콤마(,) 등 문자인 경우 - DLM 121

4.3.2. 구분자가 콤마(,)이며 Missing이 있는 경우 - DSD 122

4.3.3. 구분자가 콤마(,) 이며 Length 문을 사용하는 경우 124

4.3.4. 구분자가 탭(TABS) 인 경우 - EXPANDTABS 를 사용 126

4.4. 데이터가 변수보다 적을 때 - MISSOVER 127

4.4.1. 변수보다 실제 데이터가 많은 경우 127

4.4.2. 변수보다 실제 데이터가 적은 경우 127

4.5. SAS 시스템파일 이용하기 130

4.5.1. SAS 시스템 파일 만들고 이용하기 130

4.5.2. 팝업을 이용하여 라이브러리 만들기 131

4.5.3. auotexec.sas 만들기 133

4.6. SPSS 형태의 데이터(.sav) 파일 불러오기 134

4.7. 인터넷으로 데이터 불러오기 136

4.8. R 프로그램 138

+ Recent posts