본문 바로가기

머신러닝13

(P)제05강(09)_UCI Irvine Machine Learning Reposi.. 이용 UCI Irvine Machine Learning Repository 이용하여 버섯데이터(mushroom.csv) 와 붓꽃데이터(iris.csv) 불러오기 UCI Irvine Machine Learning Repository 에 가시면 머신러닝 실습을 위한 수많은 데이터들을 볼 수 있습니다. ## (7.1) mushroom 버섯데이터 불러오기 import urllib.request as req local = "mush.csv" url="https://archive.ics.uci.edu/ml/machine-learning-databases/mushroom/agaricus-lepiota.data" req.urlretrieve(url,local) UCI Machine Learning Repository 화면입.. 2021. 12. 13.
(R1)제14강(2.1)KNN - K-최근점 이웃( K nearest Neighbor) : 패키지 class KNN 은 군집분석(Cluster Analysis)의 응용되는 개념입니다. 군집분석은 비지도학습이고, KNN 는 지도학습입니다. 군집분석은 집단을 구분하는 분류변수가 없이 그냥 독립변수들만 가지고, 어느 관측치들이 가까운가?를 (군집으로) 분류하는 기법입니다. KNN 은 새로운 관측치가 들어오면, 관측치가 갖고 있는 변수들(독립변수들)을 가지고 기존의 관측치와 얼마나 가까운가를 계산한 다음, 가까운 몇 개의 기존의 관측치를 선택합니다.(k=3 과 같이) 이 때 이들 관측치들이 이미 어떤 그룹에 속하는 것인지를 알고 있으므로, 가장 많이 속한 그룹에 해당되는 것으로 결론을 내리는 기법이 KNN 입니다. install.packages("class") # 패키지 class 설치 library(class) # .. 2020. 12. 30.
(R1)제14강(5.1)서포트벡터머신(SVM)-데이터 iris, 패키지(e1071) 이제 머신러닝 기법 중 하나인 서포트벡터머신(SVM, Support Vector Machine)에 대한 간단한 실습을 합니다. 사용되는 데이터는 유명한 붓꽃데이타 iris 이고, 패키지는 e1071입니다. install.packages("e1071") library(e1071) svm(Species~., data = iris) model_svm 2020. 12. 30.
(R1)제14강(3.1)의사결정나무 - 데이터(iris), 패키지(rpart) 가장 많이 알려져 있는 데이터인 붓꽃 데이터(iris)를 이용하여 의사결정트리를 실행합니다. 사용되는 패키지는 {rpart} 이고, 사용되는 함수도 rpart()입니다. 뒷부분에 모형 평가를 위해 패키지 caret 사용법을 추가했습니다. 1. 의사결정나무 실행 - 패키지 rpart 이용 install.packages("rpart") # 패키지 rpart 설치 library(rpart) # 패키지 rpart 로딩 rpart(Species ~., data=iris) # 종속변수 붓꽃의 종류 Species로 하고, 나머지 변수로 의사결정모형을 실행 plot(model_rpa,compress=T,margin=0.2) # 의사결정모형의 결과를 Plot text(model_rpa, cex=1.5) # [[ 해석 ].. 2020. 12. 29.
(R1)제14강(6.1) 신경망(Neural Network) 실습 - 데이터(iris), 패키지(neuralnet) 이번 시간은 R응용 머신러닝 실습 시간입니다. 딥러닝 공부를 하기 전에, 또는 딥러닝을 조금 보다 보면 간단한 실습이라도 먼저 해보고 싶은 생각이 들곤 합니다. 머신러닝의 마지막인 신경망에 관한 간단한 실습을 합니다. 데이터는 그동안 많이 사용하여 왔고, 우리에게 익숙한 붓꽃 데이터입니다. install.packages("neuralnet") # 패키지 neurlanet 설치 library(neuralnet) # 패키지 neuralnet 로드 # iris 데이터를 이용하여 Species 예측을 하는데 hidden layer=1 로 지정 model_neu 2020. 12. 29.
(R3)제08강_01 서포트벡터머신(SVM) 실행해 보기 -iris, e1071, caret 1995년에 Vapnik와 Cortes Support Vector Machine(SVM) 발표 참고서적: An Introduction to Statistical Learning with Applications in R "SVM의 초평면을 찾는 개념은 로지스틱회귀분석과 선형판별분석과 같은 고전적인 분류기법과는 명백히 다른 것처럼 보였다... 더욱이 비선형클래스 경계를 수용하기 위해 변수공간을 확장하는 Kernel을 사용하는 개념은 독특하고 귀중한 특징처럼 여겨졌다" "하지만 이후 SVM과 고전적인 다른 방법들 사이에 깊은 관련성이 있음이 드러났다" (ISLR 9장에서 인용) 저도 처음에 SVM 을 보면서 심지어는 말도 안된다고 생각했습니다. 초평면 SVM 공부를 하려면 제일 먼저 초평면이란 개념을 알아야 .. 2020. 11. 10.