728x90

R 강의를 하다 보면 "SAS에서 R로 갈아타려고 하는데 어떡하면 좋으냐?"

"R로 전환하려는데 가능하겠는가?" 하는 질문을 합니다.

통컨(tongcon)"의 개인적인 생각입니다.

 

SAS에서 R로 갈아탈 만합니다.

우선 SAS가 너무 비쌉니다. 물론 SAS가 오랫동안 사용하여 왔기 때문에

분석 결과에 대한 안정성은 SPSS와 더불어 신뢰할 만합니다.

그럼에도 R로 대체해 볼 만합니다.

 

문제는 R을 공부해야 한다는 것입니다. 요즘 대학에서는 SAS는 거의 가르치지 않습니다.

이제는 R을 가르칩니다. 물론 Python 도 가르치고 있습니다.

이 들이 회사에 입사하게 되면 점차 R의 활용도가 높아질 것입니다.

아직 회사에서는 높은 직급의 사람들이 SAS를 선호하고 있고

젊은 직급으로 갈수록 R을 많이 사용하고 있습니다. 젊은 직급의 사람들이

승진하게 되면 점차 SAS의 활용도는 줄어들 것으로 예상됩니다.

 

제가 예전에 쓴 "SAS강좌와 통계컨설팅"의 "제29장 SAS/IML사용법"을

R로 테스트해 보고 있는데, R에서 지원하는 행렬(matrix) 객체에서 전부 가능하였습니다.

덕분에 SAS/IML과 R을 다시금 1비교해 보는 시간을 가졌습니다.

제가 SAS/IML 의 세세한 부분까지는 모르지만, 계속 R 행렬객체를 이용하여

SAS/IML의 기능과 비교해 보려고 합니다. 행렬은 참으로 응용되는 부분이 넓습니다.

 

SAS는 여러 제품이 있는데 이 중에서 SAS/IML이 카바하는 행렬부문은

R로 가능하다고 생각이 듭니다. 그런데 SAS/IML이 행렬을 다루는 데에만 사용되는 것이 아니고

SAS 프로그램 내에서도 R 코드를 지원하는 기능이 있는데 이것이 SAS/IML로 가능합니다.

암튼 SAS/IML을 자주 사용하지 않으면 R로 전환하는 것을 추천합니다.

 

SAS/GRAPH 는 SAS에서 GRAPH 기능을 담당하는 제품인데

그래픽 기능은 R이 엄청 강력하고, 편리하고, Python 도 그래픽 기능을

엄청 지원하고 있으므로  SAS/GRAPH 사용을 줄이는 것도 검토해 볼 만 합니다.

그런데 SAS/GRAPH가 단순히 그래픽 기능에 거치지 않고 SAS의 다양한 설루션의

BI 화면 등에 연동되어 있어서 SAS/GRAPH만 달랑 떼어내기 어려운 점이 있습니다.

다만 분석이 목적이면 SAS/GRAPH 도 R로 전환하는 것을 권합니다.

,

"R, 쉽다 쉽다"고들 하지만 그렇게 쉬운 것도 아닙니다.

그래도 R은 해 볼만 합니다. 우선 R 관련 자료가 엄청 많습니다.(오픈소스인 데다 강력하니까요)

여러분이 하고자 하는, 관심이 있는  연구나 프로젝트가 있으면 구글에서 "R 연구주제 소스"라고 치면

아마도 이미 다른 분들이 연구를 해 놓은 자료가 있는 것을 확인해 볼 수 있을 겁니다.

그래서 R을 추천합니다. 더구나 무료.

 

우선 회사에서 SAS를 어느 부서에서 어느 용도로 사용하고 있는지를 파악하시고

R로 전환하는 것을 고려하셔야 합니다.

부서원들이 SAS나 SPSS에 익숙한데, 나 혼자만 R을 선호한다고 하여 R로 전환하면

불편한 점이 꽤 생길 겁니다. 

SAS로부터 R로 전환 가능한 것부터 하나씩 전환하면 될 것입니다.

그리고 라이선스를 줄여 나가는 것도 한 방법이 되겠습니다...

 

+ Recent posts