SAS에서 행렬을 지원하는 제품으로 SAS/IML 이 있습니다.

R에서는 기본으로 제공되는 행렬(matrix) 객체를 이용합니다.

Python에서는 넘퍄이(Numpy)라는 라이브러리가 행렬연산을 강력하게 지원합니다. 

 

SAS에서는 PROC MEANS를 사용하여 평균값, 합계 등을 구하고

OUTPUT OUT 문을 이용하여 그 값들을 저장하고 MERGE 문을 이용하여

비율을 구합니다.

 

R 에서는 aggregate를 이용하여 평균값, 합계 등을 구하고

merge 문을 이용하여 원래의 값과 평균값을 Merge 한 뒤에

평균값 대비 비율을 구합니다.

 

SAS와 R에서는 SQL(SAS), sqldf 함수(R)를 이용하여 평균값 대비 비율을

쉽게 구할 수 있습니다.

여기서는 aggrgate함수와 merge 함수를 소개하기 위해 문제를 만들었습니다.

 

변수를 추출하거나, 변수명을 바꾸는 문제입니다.

SAS에서는 Keep, Drop, Rename 등을 사용합니다.

R에서는 열(변수)이름을 나열하기만 하면 됩니다.

단 Raname 등은 기본 데이터프레임에서는 좀 복잡하지만 패키지 dplyr 을 사용하면 간단하게 해결됩니다.

 

[구독] 클릭

SAS에서는 IF 문을 사용하고 OUTPUT을 사용합니다.

조건에 맞는 데이터를 삭제하려는 경우에는 DELETE 명령문을 사용합니다.

R에서는 data.frame 객체에서 첫번째 요소에 조건식만 주면 되고

subset 함수를 이용해도 됩니다.

 

 

 

 

 

R에서 새로운 변수만들기를 설명합니다. 또한 조건에 맞는 경우를 고려하여 변수를 만드는 것을 설명합니다.

SAS에서는 = 을 사용하고 IF ... THEN 조건을 사용하여 새로운 변수를 만듭니다.

R 에서 <- 왼쪽에 생성하고자 하는 변수를 지정하고 <- 오른쪽에 조건식을 사용하여

ifelse 문으로 새로운 변수를 만듭니다.

SAS에서 IF ... THEN 조건을 사용하여 새로운 변수를 만드는데

R에서는 새로운 변수를 만들고 그 값을 지정하는 형태입니다.

https://youtu.be/ZLl2h2229LU

 

 

 

SAS에서 회귀분석을 하려면 SAS/STAT 제품을 구입을 해야 되고

SAS/STAT 에서 제공하는 프로시져 REG 를 이용하면 됩니다.

이런 회귀분석을 R에서 실행하려면 lm( )이란 함수(linear model)를 사용하면 됩니다.

R을 설치할 때(무료) 기본적으로 stats 란 패키지가 설치되고

R을 실행하면 기본적으로 메모리에 로드됩니다.

그리하여 stats 패키지에 들어있는 여러 함수 중에서 lm()를 사용합니다.

패키지 stats 에는 무수한 통계기법들을 지원합니다.

 

https://youtu.be/9KU56zNiALU

 

+ Recent posts