본문 바로가기

CLASS2

(R1)제14강(2.1)KNN - K-최근점 이웃( K nearest Neighbor) : 패키지 class KNN 은 군집분석(Cluster Analysis)의 응용되는 개념입니다. 군집분석은 비지도학습이고, KNN 는 지도학습입니다. 군집분석은 집단을 구분하는 분류변수가 없이 그냥 독립변수들만 가지고, 어느 관측치들이 가까운가?를 (군집으로) 분류하는 기법입니다. KNN 은 새로운 관측치가 들어오면, 관측치가 갖고 있는 변수들(독립변수들)을 가지고 기존의 관측치와 얼마나 가까운가를 계산한 다음, 가까운 몇 개의 기존의 관측치를 선택합니다.(k=3 과 같이) 이 때 이들 관측치들이 이미 어떤 그룹에 속하는 것인지를 알고 있으므로, 가장 많이 속한 그룹에 해당되는 것으로 결론을 내리는 기법이 KNN 입니다. install.packages("class") # 패키지 class 설치 library(class) # .. 2020. 12. 30.
(R1)제03강(2.2) 벡터 다루기 R 에서 다루는 데이터 객체 중에 가장 많이 사용되는 것이 벡터입니다. 벡터란 단어가 익숙하지 않겠지만, 그냥 숫자열이나 문자열이라고 간단하게 생각하면 됩니다. 벡터다루기에서는 벡터를 만들고, 속성살펴보기, 벡터를 결합하기, 벡터의 요소에 접근하기, 벡터의 연산, 통계분석하기 순서대로 설명합니다. 1. 벡터 만들기 벡터를 만드는 명령어로는 ① c ② seq ③ rep 가 있습니다. (1) c 함수를 이용하기 벡터를 만드는 가장 기본적인 방법은 c( ) 함수를 이용하는 것인데 Concatenate 또는 Combine 의 약어입니다. 연속적인 원소로 구성된 벡터를 만들고자 할 때에는 : 연산자를 이용하면 편리하게 만들 수 있습니다. ● 원소가 숫자형인 경우 > c(1,2,3,4,5,6,7,8,9,10) # .. 2020. 7. 25.