본문 바로가기

R연습 200제/05_00. (R)전처리와 R 응용3

(R)제07강(2.1) 데이터 다루기 - 패키지 dplyr 이용하기 예전에 SAS를 사용할 때, SAS의 가장 큰 강점은 파일 핸들링이었습니다. R 도 SAS 못지않게 (아니면 더 훌륭한) 파일 핸들링 기능을 갖고 있습니다. 다만 R 에는 여러 패키지들이 있고, 패키지들마다 특징이 있어서, 파일핸들링을 위해 조금 어려운 점이 있었습니다. 패키지 dplyr 을 사용함으로써 SAS에서의 파일 핸들링을 거의 구현할 수 있었습니다. 패키지 dplyr 기능을 엄청 많지만 그 중에서 필수적인 것만을 나열하였습니다. # 1. 변수추출하기 - select( ) 함수 mtcars %>% select(mpg) mtcars %>% select(mpg, hp, wt) mtcars %>% select(-mpg) mtcars %>% select(-mpg,-hp) # 2. 조건에 맞는 관측치 추출.. 2022. 1. 8.
(R1)제07강(0.0) 파일핸들링 목차 - apply계열, dplyr, merge 등 데이터 핸들링 및 전처리 부분을 강의할 때에는 다음과 같은 내용을 설명합니다... apply 계열 적용하기 패키지 dply 패키지 data.table 패키지 reshape2 두 데이터 합치기 merge 미싱 다루기 - NA와 NULL 여기서 패키지 dplyr의 함수 몇 개만 알면 데이터 핸들링을 쉽게 할 수 있습니다. install.packages("dplyr") library(dplyr) data(package="dplyr") # 패키지 dplyr에 들어있는 샘플데이터를 살펴보니 별로... dplyr 패키지에 기억할 만한 함수는 대충 6가지입니다. select() 함수 - 변수추출하기 rename() 함수 - 변수 이름 바꾸기 filter() 함수 - 관측치(행) 추출하기 mutate() 함수 - 새로.. 2021. 1. 12.
(R1)제07강(1.1) apply 계열- apply, sapply, lapply 이번 시간은 apply 계열을 설명합니다. apply 함수는 "데이터객체"를 설명할 때 "행렬(matrix)" 객체에서 간단하게 설명한 바 있습니다. apply 함수는 사용법이 간단합니다. 이 간단한 apply와 유사한 함수들이 많은데 sapply, lapply, tapply ... 등이 있습니다. 그리고 apply(데이터, 1또는 2, 함수) 형태인데 함수를 사용할 수 있는 것도 유용한 기능입니다. 이 함수에 mean, sum, min,max, prod 간단한 함수를 사용하는 예제를 보이지만 다양한 함수를 적용할 수 있습니다. apply() 함수 m1 2021. 1. 12.