본문 바로가기

iris13

(R1)제14강(1.1) 군집분석 - 데이터 iris, 패키지 stats, 함수 dist, hclust, kmeans 이제 머신러닝 기법 중 하나인 군집분석(Cluster Analysis)에 대한 간단한 실습을 합니다.사용되는 데이터는 유명한 붓꽃데이타 iris 이고, 패키지는 R 설치할 때 기본적으로 설치되는 {stats}입니다. # (2.2) 군집분석 간단한 실습 -iris# 유사성 - Distance 구하기----# 각 row 들의 거리를 구한다...dist(iris[1:7,1:4]) # 7개 관측치 간의 거리를 구한다... dist01 소수7자리... 소수 3 자리dist01# Default method="euclidean"# dist01  # (2.3) 군집분석 - hclust()----hc plot(hc)plot(hc,hang=-1)?hclustdist02 소수7자리... 소수 2 자리hc02 plot(hc0.. 2020. 12. 30.
(R1)제14강(5.1)서포트벡터머신(SVM)-데이터 iris, 패키지(e1071) 이제 머신러닝 기법 중 하나인 서포트벡터머신(SVM, Support Vector Machine)에 대한 간단한 실습을 합니다. 사용되는 데이터는 유명한 붓꽃데이타 iris 이고, 패키지는 e1071입니다. install.packages("e1071") library(e1071) svm(Species~., data = iris) model_svm 2020. 12. 30.
(R3)제04강(1.1) 의사결정나무 - iris, rpart, caret 가장 많이 알려져 있는 데이터인 붓꽃 데이터(iris)를 이용하여 의사결정트리를 실행합니다. 사용되는 패키지는 {rpart} 이고, 사용되는 함수도 rpart()입니다. 뒷부분에 모형 평가를 위해 패키지 caret 사용법을 추가했습니다. 1. 의사결정나무 실행 - 패키지 rpart 이용 install.packages("rpart") # 패키지 rpart 설치 library(rpart) # 패키지 rpart 로딩 rpart(Species ~., data=iris) # 종속변수 붓꽃의 종류 Species로 하고, 나머지 변수로 의사결정모형을 실행 plot(model_rpa,compress=T,margin=0.2) # 의사결정모형의 결과를 Plot text(model_rpa, cex=1.5) # [[ 해석 ].. 2020. 12. 29.
(R1)제14강(3.1)의사결정나무 - 데이터(iris), 패키지(rpart) 가장 많이 알려져 있는 데이터인 붓꽃 데이터(iris)를 이용하여 의사결정트리를 실행합니다. 사용되는 패키지는 {rpart} 이고, 사용되는 함수도 rpart()입니다. 뒷부분에 모형 평가를 위해 패키지 caret 사용법을 추가했습니다. 1. 의사결정나무 실행 - 패키지 rpart 이용 install.packages("rpart") # 패키지 rpart 설치 library(rpart) # 패키지 rpart 로딩 rpart(Species ~., data=iris) # 종속변수 붓꽃의 종류 Species로 하고, 나머지 변수로 의사결정모형을 실행 plot(model_rpa,compress=T,margin=0.2) # 의사결정모형의 결과를 Plot text(model_rpa, cex=1.5) # [[ 해석 ].. 2020. 12. 29.
(P)제05강_파이썬 iris 데이터 이용하기 파이썬에서 seaborn 라이브러리에 내장된 데이터를 불러오면 됩니다. R패키지는 함수와 샘플데이터, 샘플프로그램들을 포함하고 있습니다. R에서는 library(패키지이름) 명령문으로 샘플데이터를 사용할 수 있습니다. iris 데이터는 R 패키지 datasets에 포함되어 있습니다. 파이썬에서는 seborn 라이브러리에서 load_datset( ) 를 이용하여 데이터를 불러올 수 있습니다. import seaborn as sns iris = sns.load_dataset('iris') iris.head(6) 타이타닉 데이터를 불러오려면 titanic = sns.load_dataset('titanic') titanic.head(6) 그럼 seaborn에서 어떤 데이터가 내장되어 있는가?를 보려면 sns.g.. 2020. 12. 14.
(R3)제08강_01 서포트벡터머신(SVM) 실행해 보기 -iris, e1071, caret 1995년에 Vapnik와 Cortes Support Vector Machine(SVM) 발표 참고서적: An Introduction to Statistical Learning with Applications in R "SVM의 초평면을 찾는 개념은 로지스틱회귀분석과 선형판별분석과 같은 고전적인 분류기법과는 명백히 다른 것처럼 보였다... 더욱이 비선형클래스 경계를 수용하기 위해 변수공간을 확장하는 Kernel을 사용하는 개념은 독특하고 귀중한 특징처럼 여겨졌다" "하지만 이후 SVM과 고전적인 다른 방법들 사이에 깊은 관련성이 있음이 드러났다" (ISLR 9장에서 인용) 저도 처음에 SVM 을 보면서 심지어는 말도 안된다고 생각했습니다. 초평면 SVM 공부를 하려면 제일 먼저 초평면이란 개념을 알아야 .. 2020. 11. 10.