본문 바로가기

분류 전체보기240

12.2. SAS/IML 사용법 기초(s1) SAS/IML에서 사용되는 각 연산자에 대한 예를 들어 설명함으로 이해하기 쉽도록 하였습니다. /*----------------------------------------------------------*/ /* IML의 여러기능들을 실행한 프로그램 – 12_iml.sas */ /*---------------------------------------------------------*/ PROC IML; a={ 1 2 3 4}; b={ 1 2 , 7 8}; c={ 3 4 , 5 6}; a2=2*a; /* 행렬 a의 각 원소를 2배 곱한다 */ bcsum=b+ 10*c; /* 행렬 c의 원소를 10배 한 것과 행렬 b를 더한 것 */ bcmul1=b*c; /* 행렬 b와 행렬 c를 곱한 것 (행렬연산) *.. 2020. 7. 10.
통계학 공부할 때, 검은 공, 흰공 공부는 그만... 고등학교 시절 "순열", "조합"을 공부한 적이 있는데, 공부를 하면 이해가 되다가도 정작 문제를 풀면 이게 맞는지 저게 맞는지 헷갈리곤 했습니다. 대학 시절, 과외알바를 한 적이 있는데, 순열, 조합 부분을 가르칠 때에는 꼭 예습을 했고, 미리 문제를 풀어 보고 갔습니다. 해답을 보기 전에는 헷갈리기 때문이었습니다. 빅데이터 시대를 맞이하여 통계학을 공부하려는 사람들이 많은데 통계학 책 중에서, "검은 공이 5개 있고, 흰공이 3 개 있는데 여기에서 검은 공을 2개, 흰 공을 2개 꺼집어 낼 확률을 구하라..." "공을 꺼집어 낼 때, 다시 주머니에 넣을 때(with replacement)와 주머니에 다시 넣지 않을 때" "순서가 있으니 어쩌고, 순서가 없으니 저쩌고.." 너무 신경 쓰지 말고... 건.. 2020. 7. 10.
11.2 SELECT 문, ORDER BY(s1) PROC SQL을 사용한 가장 간단한 예입니다. 사용된 데이터와 프로그램은 SAS연습의 기초부분에 해당되는 예입니다. PROC SQL 을 실행하면 창제목에 ‘SQL 프로시져 실행중’ 이라는 제목이 나타납니다. 이런 경우 DATA 문은 만나거나 QUIT; 문장을 실행하면 없어집니다. 11.2.1 SELECT... FROM /*--------------------------------------*/ /* PROC SQL 을 이용한 가장 간단한 예 */ /*--------------------------------------*/ 1 DATA survey; 2 INPUT seq $ gender $ wei hei age; CARDS; A001 F 65 171 23 A002 F 66 173 24 A003 M 69 .. 2020. 7. 9.
(잔차)제곱합, (평균)제곱합 , 두 평균제곱합의 비율(=F값) 제곱합(Sum of squares, SS) 그냥 주어진 숫자들을 제곱하여 합한 값입니다. 그런데 한편으로는 (주어진 숫자 - 평균값=편차)을 제곱하여 합한 값을 의미하기도 합니다.(잔차 제곱합) 편차제곱합(SS) (주어진 숫자 - 평균값=편차)를 그냥 제곱하고, 그냥 합한 값입니다.(잔차 제곱 합의 의미) 카이제곱 분포를 따릅니다. 평균 제곱합(MS) - 편차 제곱합(SS)/ (n-1) - 편차 제곱합을 n-1로 나눈 값입니다. n-1 은 자유도라고 합니다. - 두 개의 평균 제곱합이 있는 경우, 두 MS의 비율은 F 분포를 따릅니다. - 분산 분석법이나 회귀분석의 결과를 보면, 2개의 평균 제곱 합의 비율을 구하는 부분이 있습니다. 이것이 바로 F 값입니다. 2020. 7. 9.
R 강의를 들을 때, 통계학을 얼마나 알아야 하나요? (질문) 취업준비생 대상으로 강의를 할 때, 질문한 내용입니다. (취준생 대상 강의는 3개월, 어떤 경우에는 6개월 코스도 있습니다.) 이런 과정에는 IT의 전반적인 것을 배우게 됩니다. 파이썬도 배우고, DBMS/SQL, R(R은 R언어와 통계학) 강의 중 쉬는 시간에 "통계학을 잘 모르는데, R강의를 따라 갈 수 있을까요?" 하는 질문을 받는 적이 간혹 있습니다. "나의 강의는 평균, 분산, 정규분포 정도만 알면 됩니다." "평균(Mean)"이야 초등학교 때부터 아는 것이고, "분산(Variance)"도 중학교 정도면 알 것이고, "정규분포"는 고등학교 때 들은 것일 테고... 이 정도만 알면, 내가 강의하는 것을 따라올 수 있다고 합니다. 이 중에서 분산(variance)은 (변수의 값들-평균값)을 구하고 .. 2020. 7. 8.
역전파(?) 뭐예요... 역("거꾸로") 전파("전달한다")... 逆傳播 "머신러닝", "머신러닝" 하니까 새로운 것인 줄 알고 들여다보니 머신러닝의 여러 기법들이 통계학의 다변량 분석기법들과 거의 같은 것을 알고 머신러닝이 다변량 통계기법과 비슷하고, 알고리즘을 의미하는 모양이구나... 생각하게 되었습니다. 그러다 딥러닝 세미나에 참석하게 되었는데 "역전파" "역전파" 하길래 무슨 "전자기파"의 일종으로 딥러닝에서는 "음파" "파장" 같은 것을 다루는 모양이구나 라고 생각했습니다. "역전파"는 역逆으로 전파되는 무슨 "전자기파"의 개념을 이용한 모형인 모양이구나.... 알고 보니 그런 뜻이 아니고 "역(거꾸로, 逆)으로 전파(전달하는, propagation) 傳播되는 것" ^^^ 딥러닝의 Hidden Layer 모형, 그리고 "백 프로프게이션"이라... 멋진 생각들... 어.. 2020. 7. 8.