728x90

5.1. 텍스트 파일 다루기 130

5.1.1. 텍스트 파일 읽기와 저장하기 131

5.1.2. csv 파일 읽기와 저장하기 134

5.1.3. 구분자로 분리되어 있는 경우 - sep 136

5.1.4. 고정길이 포맷 데이터 137

5.2. scan( ), readline( ) 함수를 이용하기 138

5.2.1. scan( ) 함수 이용하기 138

5.2.2. readline( ), readLimes( ) 함수 이용하기 139

5.3. 엑셀 파일 다루기 141

5.4. SAS 또는 SPSS 파일 다루기 143

5.4.1. SAS 데이터 읽어들이기 sample.7bdat 143

5.4.2. SPSS 데이터 읽어들이기 sample.sav 144

5.5. 기타 파일 다루기 Rdata, 인터넷 145

5.5.1. Rdata 파일 다루기 145

5.5.2. 인터넷에서 불러오기 url 이용 145

5.5.3. UTF-8 데이터인 경우 - fileEncoding="UTF-8" 147

5.5.4. 시계열 데이터 다루기 148

 

R 은 다양한 외부파일을 읽어와서 작업하는 경우가 많습니다.

일반 텍스트 파일, 컴마로 구분된 CSV 파일, 엑셀파일, SAS 파일, SPSS 파일 등

이제 외부 파일을 읽어 들이는 방법에 대하여 알아보도록 하겠습니다.

보통 설문조사를 한 다음 회수된 설문지를 입력할 때 엑셀을 많이 사용합니다.

엑셀데이터는 수 천만 건의 데이터를 다루는데 한계가 있기 때문에 대용량의 데이터를 전달할 때에는

텍스트 형태를 많이 사용하게 됩니다.

이때 각 변수들이 고정형식으로 일정 양식으로 입력되는 경우가 있지만, 메모리를 많이 차지하기 때문에

구분자(delimiter) 를 사용하여 변수 사이에 ‘|’ 이나 ‘,’ 등을 사용하기도 하고 탭(tabs)를 사용하여 구분하기도 합니다.

또한 변숫값이 없는 경우 비워두거나 9999 등으로 표시하기도 합니다.

이렇게 다양한 형태로 된 데이터를 받았을 때 가장 먼저 해야 하는 일은 좌우지간 R로 읽어 들여야 합니다.

이렇게 읽어 들인 다음에 평균값을 구하든 회귀분석을 하든지 그것은 그다음 문제입니다.

또한 많은 분들이 엑셀로 되어 있는 경우, 어떻게 읽어 들이는가에 대한 문의가 제일 많습니다.

또한 분석 결과를 엑셀로 저장하거나 텍스트파일로 저장할 때도 있고, R 작업 과정 중에 생긴 파일들을 다음에 사용할 수 있도록 저장하는 등 다양한 형태의 업무와 부딪히게 됩니다.

 

 

 

+ Recent posts