본문 바로가기

FAQ & 궁금한 것20

4-2(g) 샘플데이터(잠정)과 적용통계기법 샘플데이터는 계속 수정중에 있습니다... I. 다음은 귀하께서 직장생활을 하면서 평소 느끼고 계시는 사항에 관한 것입니다. 귀하의 생각과 일치하는 번호에 00 표하여 주십시오. 1. 귀하는 지금의 회사에서 근무하는 데 보람과 긍지를 느끼고 있습니까? ①매우 그렇지 않다 ②그렇지 않다 ③그저 그렇다 ④그렇다 ⑤매우 그렇다 2. 귀하의 임금 보수체계에 만족하십니까? ①매우 그렇지 않다 ②그렇지 않다 ③그저 그렇다 ④그렇다 ⑤매우 그렇다 3. 귀하의 월평균 급여액은 얼마나 됩니까? 만원 II. 다음은 여가활동에 관한 사항입니다. 1. 귀하는 여가를 어떻게 보내고 있습니까?(2가지를 선택하세요) ① 독서 ② 스포츠 ③ 영화감상 ④ 낚시 ⑤ 등산 ⑥ 음악 감상 ⑦ 여행 ⑧ 기타 (_____) I. 다음은 응답자 .. 2020. 7. 21.
(3)(g) 통계기법 4가지(R 실습)- t검정,ANOVA,상관분석,회귀분석 SAS 또는 SPSS 에서 R로 갈아타는 것이 가능한지 궁금해 하는 사람들이 많을 겁니다. 저도 그런 사람 중 하나입니다. R 강의 중에도 가끔 듣는 질문이기도 합니다. "무조건 R로 다 됩니다. 아무 걱정말고 R로 갈아타세요..." 무책임한 말인 듯 합니다. 뭐 하나 하나 예를 들어가며 그 가능성을 설명하면 그나마 걱정이 덜해질 듯 합니다. 그래서 우선 통계기법부터 하나씩 시작해 봅니다. 궁금한 부분이 있으면 댓글을 부탁드립니다. (1-1) 카이제곱법 SAS 예제 /* 카이제곱법 간단한 형태 */ DATA a1;INPUT gender $ hob count ; CARDS; F 1 5 F 2 15 F 3 20 F 4 10 M 1 30 M 2 20 M 3 15 M 4 15 ; PROC FREQ;TABLES .. 2020. 7. 15.
SAS에서 R로 갈아타는 것이 가능한가? (궁금) R 강의를 하다 보면 "SAS에서 R로 갈아타려고 하는데 어떡하면 좋으냐?" "R로 전환하려는데 가능하겠는가?" 하는 질문을 합니다. 통컨(tongcon)"의 개인적인 생각입니다. SAS에서 R로 갈아탈 만합니다. 우선 SAS가 너무 비쌉니다. 물론 SAS가 오랫동안 사용하여 왔기 때문에 분석 결과에 대한 안정성은 SPSS와 더불어 신뢰할 만합니다. 그럼에도 R로 대체해 볼 만합니다. 문제는 R을 공부해야 한다는 것입니다. 요즘 대학에서는 SAS는 거의 가르치지 않습니다. 이제는 R을 가르칩니다. 물론 Python 도 가르치고 있습니다. 이 들이 회사에 입사하게 되면 점차 R의 활용도가 높아질 것입니다. 아직 회사에서는 높은 직급의 사람들이 SAS를 선호하고 있고 젊은 직급으로 갈수록 R을 많이 사용하고.. 2020. 7. 11.
통계학 공부할 때, 검은 공, 흰공 공부는 그만... 고등학교 시절 "순열", "조합"을 공부한 적이 있는데, 공부를 하면 이해가 되다가도 정작 문제를 풀면 이게 맞는지 저게 맞는지 헷갈리곤 했습니다. 대학 시절, 과외알바를 한 적이 있는데, 순열, 조합 부분을 가르칠 때에는 꼭 예습을 했고, 미리 문제를 풀어 보고 갔습니다. 해답을 보기 전에는 헷갈리기 때문이었습니다. 빅데이터 시대를 맞이하여 통계학을 공부하려는 사람들이 많은데 통계학 책 중에서, "검은 공이 5개 있고, 흰공이 3 개 있는데 여기에서 검은 공을 2개, 흰 공을 2개 꺼집어 낼 확률을 구하라..." "공을 꺼집어 낼 때, 다시 주머니에 넣을 때(with replacement)와 주머니에 다시 넣지 않을 때" "순서가 있으니 어쩌고, 순서가 없으니 저쩌고.." 너무 신경 쓰지 말고... 건.. 2020. 7. 10.
(잔차)제곱합, (평균)제곱합 , 두 평균제곱합의 비율(=F값) 제곱합(Sum of squares, SS) 그냥 주어진 숫자들을 제곱하여 합한 값입니다. 그런데 한편으로는 (주어진 숫자 - 평균값=편차)을 제곱하여 합한 값을 의미하기도 합니다.(잔차 제곱합) 편차제곱합(SS) (주어진 숫자 - 평균값=편차)를 그냥 제곱하고, 그냥 합한 값입니다.(잔차 제곱 합의 의미) 카이제곱 분포를 따릅니다. 평균 제곱합(MS) - 편차 제곱합(SS)/ (n-1) - 편차 제곱합을 n-1로 나눈 값입니다. n-1 은 자유도라고 합니다. - 두 개의 평균 제곱합이 있는 경우, 두 MS의 비율은 F 분포를 따릅니다. - 분산 분석법이나 회귀분석의 결과를 보면, 2개의 평균 제곱 합의 비율을 구하는 부분이 있습니다. 이것이 바로 F 값입니다. 2020. 7. 9.
R 강의를 들을 때, 통계학을 얼마나 알아야 하나요? (질문) 취업준비생 대상으로 강의를 할 때, 질문한 내용입니다. (취준생 대상 강의는 3개월, 어떤 경우에는 6개월 코스도 있습니다.) 이런 과정에는 IT의 전반적인 것을 배우게 됩니다. 파이썬도 배우고, DBMS/SQL, R(R은 R언어와 통계학) 강의 중 쉬는 시간에 "통계학을 잘 모르는데, R강의를 따라 갈 수 있을까요?" 하는 질문을 받는 적이 간혹 있습니다. "나의 강의는 평균, 분산, 정규분포 정도만 알면 됩니다." "평균(Mean)"이야 초등학교 때부터 아는 것이고, "분산(Variance)"도 중학교 정도면 알 것이고, "정규분포"는 고등학교 때 들은 것일 테고... 이 정도만 알면, 내가 강의하는 것을 따라올 수 있다고 합니다. 이 중에서 분산(variance)은 (변수의 값들-평균값)을 구하고 .. 2020. 7. 8.