728x90

 

제1강 1절 SAS 특징 : youtu.be/2dJR7xsGbV8

 

SAS는 미국 North Carolina에 있는 SAS 연구소에 의해 개발된 통계분석용 패키지(Package)입니다.

처음에는 통계적 전산처리를 위한 것이었으나 지금은 시계열분석(SAS/ETS), 파일관리, 데이터베이스(SAS/SQL), 그래프(SAS/GRAPH), 행렬계산(SAS/IML) 등 거의 모든 자료처리에 막강한 힘을 발휘하고 있습니다.

"Data Analysis"라 하면 SAS를 연상할 만큼 세계적으로 광범위하게 사용되고 있습니다.

SAS는 다음과 같은 특징을 지니고 있습니다.

1.1 SAS 특징

(1) 자료관리와 처리의 효율성 대용량 데이터분석에 편리

 자료관리(File Handling, FIle Management)와 자료처리(Data Processing)에 있어 어느 패키지보다도 체계적이고 효율적입니다. 하드디스크를 엑세스하기 때문에 메모리용량을 넘어서는 대용량 데이터 분석이 가능합니다.

 

(2) 사용의 용이성 .

 자바 등 컴퓨터 언어를 이용하면 어렵게 며칠씩 걸리는 작업도 SAS를 이용하면 몇 줄의 프로그램으로 간단하게 끝낼 수 있습니다.

또한 SAS 프로그램은 세미콜론(;)으로 구분되는 Free Format 형식이므로 사용하기에 편리합니다.

 

(3) 다양한 통계분석 기법 활용 – 프로시져 이용

 다양한 통계분석 기법들을 실행할 수 있는 다양한 프로시져(Procedures) 들이 제공되므로, 통계학 책에서 배웠던 이론들을 해당 프로시져를 불러 와서 쉽게 사용할 수 있어서 통계적 이론의 실제적 의미를 쉽게 이해할 수 있고 다양한 분석결과를 구할 수 있습니다.

관련 프로스져에 대한 매뉴얼이 잘 정리되어 쉽게 참고할 수 있습니다.

 

(4) SAS 프로그램 작성의 다양한 융통성

 SAS 프로그램은 윈도우, , 리눅스 환경 등 다양한 운영체계에서도 사용 가능하며, 다양한 데이터베이스(DBMS)를 쉽게 접근할 수 있는 기능을 제공하고 있습니다.

PC에서 작성한 SAS 프로그램은 중대형컴퓨터에서 사용할 수 있으므로, PC에서 SAS를 이용한 사람은 중대형컴퓨터에서도 쉽게 SAS를 이용하여, 대용량 데이터분석을 할 수 있습니다.

 

(5) SAS 는 여러 개의 제품으로 구성

 SAS 제품은 하나로 구성되어 있지 않고 여러 개의 제품으로 구성되어 있습니다.

SAS/BASE, SAS/STAT, SAS/GRAPH, SAS/IML, SAS/ETS 등 여러 개의 제품으로 구성되어 있고, 필요에 따라 필요한 제품을 선택하여 사용할 수 있습니다. SAS 는 오픈소스가 아니며 가격이 비싼 편입니다. 무료 제품으로는 SAS University Edition 이라는 제품도 있습니다.

 

 

1.2 SAS 종류

SAS는 하나의 제품으로 되어 있는 것이 아니고 약 30여 개의 이상 되는 수많은 제품군(솔루션)으로 구성되어 있고 이 들 각 제품들을 통합적으로 사용할 수 있습니다.

 

(1) BASE SAS(SAS 시스템 기본엔진)

SAS 시스템의 핵심 제품으로, 다른 SAS 제품을 하나로 통합하는 역할을 하고 SAS여러 가지 제품(솔루션)가동시키는데 필요한 SAS 환경을 지원하므로 기본적으로 필요합니다.

SAS 시스템의 통합적 조작 환경인 DMS(Display Manager System) 있고 또한 기본적인 기능인 데이터관리, 각종 보고서 작성기능 그리고 간단한 기술통계를 구할 수 있는 프로시져들이 포함되어 있습니다.

 

(2) SAS/STAT(통계분석도구)

SAS/STATt-검정, 분산분석법(ANOVA), χ2-검정, 회귀분석 등 간단한 통계분석기법에서부터 로지스틱회귀분석, 주성분분석, 요인분석, 판별분석, 군집분석 등 다변량 분석기법에 이르기까지 각종 통계기법을 지원하는 것으로 SAS의 핵심제품입니다.

 

(3) SAS/ETS(시계열분석)

시계열분석 및 계량경제모형(Econometrics)을 지원하는 제품으로 계량경제모델에서 사용되는 여러 가지 계량경제학의 여러 기법을 제공합니다.

이동평균법(Moving Average), 박스-젠킨스 모형(Box-Jenkins Model), 계절변동요인을 제거하는 X-11 ARIMA 등 여러분들이 알고 있는 모든 기법을 갖고 있습니다.

 

(4) SAS/IML(대화형 행렬연산)

대화형 행렬(Matrix)을 지원하는 제품으로, 행렬의 연산에 필요한 모든 기능을 제공하며 역행렬(Inverse Matrix) 등을 한 줄로 간단하게 구할 수 있습니다.

회귀분석, 로짓모형, 선형모형(Linear Programming) 등을 개발할 수 있으며, 산업연관모형 분석 등 여러 가지 모형을 개발하는 데 사용할 수 있습니다. 그리고 SAS/IML을 이용하여 R과도 연동이 가능합니다.

 

(5) SAS/GRAPH(Graphics)

SAS에서 다룰 수 있는 방대한 데이터를 시각적으로 표시하여 다양한 의사결정에 도움을 주는 제품입니다.

간단한 명령문으로 다양한 그래픽을 작성할 수 있으며 복수 그래픽의 합성 등 편집기능을 제공합니다.

 

(6) SAS/ASSIST

메뉴형식의 사용자 인터페이스 소프트웨어로 SAS 문장을 만들지 않고, 메뉴 방식으로 SAS System 을 활용할 수 있도록 지원합니다.

 

(7) SAS/ACCESS (데이터베이스와 파일 인터페이스)

SAS/ACCESSSAS의 핵심기술인 Multi Engine Architecture를 가능하게 하는 제품으로 20 가지 이상 다양한 데이터베이스와 다양한 파일 형태를 지원합니다.

SAS/ACCESS를 통하여 데이터베이스의 구조와 포맷에 별로 신경을 쓰지 않고도 쉽게 연동할 수 있고, SAS에서 지원하는 SQL을 통하여 이들 데이터베이스 자료들을 쉽게 처리할 수 있습니다.

이 밖에 여러 가지 제품들이 있습니다. SAS 제품에 대하여 살펴보려면 메뉴 [도움말]-[SAS 도움말과 문서]를 클릭하면 [SAS 제품]에 대한 상세내역을 알 수 있고, 매뉴얼들에 대한 내용도 볼 수 있습니다.

 

참고:
SAS강좌와 통계컨설팅 제1강 SAS설치와 실습

SAS 메뉴 [도움말] - [SAS도움말과 문서] - [SAS제품] 대한 상세내역 참고

+ Recent posts