본문 바로가기

조인호94

12.2. SAS/IML 사용법 기초(s1) SAS/IML에서 사용되는 각 연산자에 대한 예를 들어 설명함으로 이해하기 쉽도록 하였습니다. /*----------------------------------------------------------*/ /* IML의 여러기능들을 실행한 프로그램 – 12_iml.sas */ /*---------------------------------------------------------*/ PROC IML; a={ 1 2 3 4}; b={ 1 2 , 7 8}; c={ 3 4 , 5 6}; a2=2*a; /* 행렬 a의 각 원소를 2배 곱한다 */ bcsum=b+ 10*c; /* 행렬 c의 원소를 10배 한 것과 행렬 b를 더한 것 */ bcmul1=b*c; /* 행렬 b와 행렬 c를 곱한 것 (행렬연산) *.. 2020. 7. 10.
11.2 SELECT 문, ORDER BY(s1) PROC SQL을 사용한 가장 간단한 예입니다. 사용된 데이터와 프로그램은 SAS연습의 기초부분에 해당되는 예입니다. PROC SQL 을 실행하면 창제목에 ‘SQL 프로시져 실행중’ 이라는 제목이 나타납니다. 이런 경우 DATA 문은 만나거나 QUIT; 문장을 실행하면 없어집니다. 11.2.1 SELECT... FROM /*--------------------------------------*/ /* PROC SQL 을 이용한 가장 간단한 예 */ /*--------------------------------------*/ 1 DATA survey; 2 INPUT seq $ gender $ wei hei age; CARDS; A001 F 65 171 23 A002 F 66 173 24 A003 M 69 .. 2020. 7. 9.
R 강의를 들을 때, 통계학을 얼마나 알아야 하나요? (질문) 취업준비생 대상으로 강의를 할 때, 질문한 내용입니다. (취준생 대상 강의는 3개월, 어떤 경우에는 6개월 코스도 있습니다.) 이런 과정에는 IT의 전반적인 것을 배우게 됩니다. 파이썬도 배우고, DBMS/SQL, R(R은 R언어와 통계학) 강의 중 쉬는 시간에 "통계학을 잘 모르는데, R강의를 따라 갈 수 있을까요?" 하는 질문을 받는 적이 간혹 있습니다. "나의 강의는 평균, 분산, 정규분포 정도만 알면 됩니다." "평균(Mean)"이야 초등학교 때부터 아는 것이고, "분산(Variance)"도 중학교 정도면 알 것이고, "정규분포"는 고등학교 때 들은 것일 테고... 이 정도만 알면, 내가 강의하는 것을 따라올 수 있다고 합니다. 이 중에서 분산(variance)은 (변수의 값들-평균값)을 구하고 .. 2020. 7. 8.
역전파(?) 뭐예요... 역("거꾸로") 전파("전달한다")... 逆傳播 "머신러닝", "머신러닝" 하니까 새로운 것인 줄 알고 들여다보니 머신러닝의 여러 기법들이 통계학의 다변량 분석기법들과 거의 같은 것을 알고 머신러닝이 다변량 통계기법과 비슷하고, 알고리즘을 의미하는 모양이구나... 생각하게 되었습니다. 그러다 딥러닝 세미나에 참석하게 되었는데 "역전파" "역전파" 하길래 무슨 "전자기파"의 일종으로 딥러닝에서는 "음파" "파장" 같은 것을 다루는 모양이구나 라고 생각했습니다. "역전파"는 역逆으로 전파되는 무슨 "전자기파"의 개념을 이용한 모형인 모양이구나.... 알고 보니 그런 뜻이 아니고 "역(거꾸로, 逆)으로 전파(전달하는, propagation) 傳播되는 것" ^^^ 딥러닝의 Hidden Layer 모형, 그리고 "백 프로프게이션"이라... 멋진 생각들... 어.. 2020. 7. 8.
2.3 Regulization - Ridge 실습 (참고: ISLR...수정중) 참고문헌: An Introductio to Statistical Learning with Applications in R 다음 프로그램은 ISLR 6장을 참고한 것입니다. 예제는 Hitters 인데 조금 어려운 것 같아서 보다 쉬운 샘플을 구상중 선형모델의 확장에 해당되는 내용입니다. 다루는 내용은 3가지 분야입니다. (1) 독립변수들의 부분집합 선택 ; subset 전진선택법(forward), 후진제거법(backward), 스텝와이즈법(stepwise) 관련지표 - Cp, AIC, BIC, Adjusted R2 (2) Ridge - 능선회귀 또는 능형회귀 라고 불림 Lasso (3) 주성분회귀(PCR, Principal Component Regression), 부분최소제곱 PLS, Partial Lea.. 2020. 7. 7.
R에서 패키지 tm과 ts 가 어떻게 다른가? 참 간단한 질문이긴 한데, R에는 패키지가 만 개가 넘으니 헷갈리기도 합니다. 이름은 비슷하지만 전혀 다른 패키지이고, R 응용분야에 엄청나게 많이 사용되는 패키지입니다. tm 은 Text Mining 텍스트마이닝을 하는 패키지이고 ts 는 Time Series 시계열분석을 하는 패키지입니다. 2020. 7. 5.