조인호83 (g) SPSS, SAS, R 비교 통계분석을 하려면 (1) 우선 데이터가 있어야 하고 (2) 분석하고자 하는 목적(또는 연구목적) 이 있어야 하고 심지어 그냥, 한 번 해 보고 싶어서... 경험 삼아... 등 (3) 분석 목적에 맞는 분석 통계기법으로 어떤 기법이 적당한지 알아야 되고 (4) 기법을 사용하여 분석하고, 결론 도출하는 과정을 거치면 됩니다. 쉬운 것 같이 보이지만, 한 단계, 한 단계 엄청 만만치 않습니다. 그래도 한 번 해 보는 것이 통계학을 이해하고, 실전에 적용하는데 매우 도움이 됩니다. 통계분석 패키지 - SPSS, SAS, R 통계 분석하려면 통계분석용 소프트웨어가 있어야 합니다. 물론 엑셀에서도 통계분석 기능이 있습니다. (1) SPSS 우선 가장 편안하고 많이 사용되는 패키지로는 SPSS 를 들 수 있습니다. .. 2020. 9. 21. (2)g 통계기법 4가지-t검정,ANOVA,상관분석/회귀분석, 카이제곱법 통계기법 중에 수많은 통계기법들이 있습니다. 이 중에서 우선 4가지 기법을 먼저 아시면 통계학을 공부하는데 도움이 됩니다. "4(싸)가지"란 단어가 비속하더라도 양해를 부탁합니다. 여러분의 이해를 위해서 그러한 것이 양해 부탁드립니다. 4가지 기법은 ① t 검정, ②분산분석법(ANOVA, F검정), ③상관분석과 회귀분석 그리고 ④ 카이제곱검정 입니다. 이것이 학부 때 통계학 시간 때 배우는 기법입니다. ① t 검정 갑자기 생뚱맞게 영어단어가 t가 나오니 많이 당황하셨죠? 그냥 t 입니다. A라고 생각하셔도 되고요. 나중에 설명드리도록 하고, 당분간 영어 t 라고만 생각하시면 됩니다. 어떤 때 사용하냐? 하면 "두 그룹 간의 평균치 차이"를 검정하는 데 사용합니다. 참 간단하죠? 두 그룹이라... 그리고 .. 2020. 9. 19. 18.2(g) MariaDB 다운로드 및 설치하기 이제 데이터베이스에 대하여 설명합니다. 여러분은 주로 엑셀데이터(또는 csv) 주로 이용하고 있을 겁니다. 그런데 금융권이나 일반 회사에서는 데이터베이스를 많이 사용합니다. 그리고 여러분 들도 데이터베이스... 데이터베이스...DBMS(Data base Management System) 이라는 단어를 많이 들었을 것입니다. 데이터 분석을 하는 사람들은 데이터베이스의 깊은 곳까지는 알 필요는 없습니다. IT 분야에 종사하는 사람들도 데이터베이스 전공자나 관련분서에 일하지 않으면 DB 의 깊은 부분을 잘 알지 못합니다. 그럼에도 회사에 취업을 앞두거나 하는 경우에는 DB에 대하여 어느 정도는 알고 있어야 합니다. 그래서 DB를 가장 잘 접근할 수 있도록 쉽게 설명하고자 합니다. 우선 무료인 MariaDB를 .. 2020. 9. 19. 7.1 나이브베이즈란? * "최대우도함수" "Maximum Likelihood Estimator"를 보다가 "likelihood"가 어디에 사용되는가? 에 대한 예제를 준비하다가 머신러닝의 한 기법인 "나이브베이즈("naivBayes")를 사례로 들면 되겠다는 생각에 정리해 보았습니다. 여기서는 iris 데이터의 경우를 예로 들었지만, 범주형데이터인 경우인 스팸메일인 경우 또는 Titanic 데이터를 정리하여 추후에 올릴려고 합니다. 베이지안은 과거의 이미 일어난 어떤 사건의 “사전확률”“사전 확률”을 알고 있을 때, 앞으로 어떤 사건이 일어날 확률(사후 확률)을(사후확률) 결정하는 이론입니다. 기초통계학에 나오는 베이즈 추론의 식은 다음과 같습니다. P(A|B)는 사건 B가 일어났을 때 사건 AA 가 일어날 조건부 확률을 말.. 2020. 8. 30. 4일째 4.2 odds, logit, 시그모이드함수, 소프트맥스 소프트맥스 정리하기 이제 딥러닝 4일째 들어섭니다. 다층신경망, 심층신경망 그리고 가중치 문제 등 을 익힙니다. 그러다가 보면 출력층에 값들이 생성됩니다. 그런데 분류문제라고 하면 이들 출력층의 값들을 확률값으로 변환하면 편리합니다. 그러기에 앞서 몇 가지 용어를 정리해 봅니다. 중간단계에 사용되는 활성화함수 중 시그모이드 함수 등을 적용하게 되는데 시그모이드 시그모이드 하는데 시그모이드가 뭐지? 우선 시그모이드를 살펴 봅니다. sigmoid의 뜻은 " shaped like the letter S:" "S랑 비슷한" 뜻이구나. 이와 관련하여 여러가지 용어가 나오는데 하나하나 살펴 보겠습니다. 오즈,odds 성공할 확률이 실패할 확률보다 몇 배인가?를 나타내는 비율 p/(1-p) 비가 올 확률이 75% 이.. 2020. 8. 18. 4일째 4.1 각 층의 신호 전달 구현 & 델타 규칙 신경망의 지도 학습 1. 신경망의 가중치 wi를 적당한(?) 값으로 초기화 설정 2. 입력값과 출력값 yj을 입력 3. 입력값과 가중치를 이용하여 계산(곱하여 합하기) dj 값을 구함 4. 계산된 값 dj와 출력값 yj의 오차 ej를 계산 ei = di - yi 5. 이 오차가 최소가 되도록 신경망의 가중치 wj를 조절 $$\bigtriangleup w_{ij} = \alpha e_i x_j$$ 6. 전체 데이터에 대하여 2~5 단계를 반복합니다. 가중치 조정 규칙? 두 노드 간의 가중치는 입력 노드의 값 xj와 오차 ej에 비례하여 조정한다... 가중치 Wij 는 노드 j에서 노드 i로 들어가는 가중치 입니다... 매우 주의 $$w_{ij}\leftarrow w_{ij} + \alpha e_i x_j$.. 2020. 8. 18. 이전 1 ··· 6 7 8 9 10 11 12 ··· 14 다음