이제 머신러닝 기법 중 하나인 군집분석(Cluster Analysis)에 대한 간단한 실습을 합니다.
사용되는 데이터는 유명한 붓꽃데이타 iris 이고, 패키지는 R 설치할 때 기본적으로 설치되는 {stats}입니다.
# (2.2) 군집분석 간단한 실습 -iris
# 유사성 - Distance 구하기----
# 각 row 들의 거리를 구한다...
dist(iris[1:7,1:4]) # 7개 관측치 간의 거리를 구한다...
dist01 <- round(dist(iris[1:14,1:4]),digits=3) # 소수7자리... 소수 3 자리
dist01
# Default method="euclidean"
# dist01 <- round(dist(iris[1:14,1:4],method="euclidean"),digits=3);dist01
# (2.3) 군집분석 - hclust()----
hc <- hclust(dist01, method="ave")
plot(hc)
plot(hc,hang=-1)
?hclust
dist02 <- round(dist(iris[,1:4]),digits=3) # 소수7자리... 소수 2 자리
hc02 <- hclust(dist02, method="ave")
plot(hc02)
plot(hc02,hang=-1)
# (2.4) Kmeans----
iris01 <- iris
iris01$Species <- NULL
iris01
model_km <- kmeans(iris01,3)
model_km
table(iris$Species,model_km$cluster)
par(mfrow=c(1,2))
plot(iris$Sepal.Length,iris$Sepal.Width,col=iris$Species)
plot(iris$Sepal.Length,iris$Sepal.Width,col=model_km$cluster)
'R 일반 > 14. R 응용(1)(R1)' 카테고리의 다른 글
(R1)제14강(2.1)KNN - K-최근점 이웃( K nearest Neighbor) : 패키지 class (0) | 2020.12.30 |
---|---|
(R1)제14강(5.1)서포트벡터머신(SVM)-데이터 iris, 패키지(e1071) (0) | 2020.12.30 |
(R1)제14강(3.1)의사결정나무 - 데이터(iris), 패키지(rpart) (0) | 2020.12.29 |
(R1)제14강(6.1) 신경망(Neural Network) 실습 - 데이터(iris), 패키지(neuralnet) (0) | 2020.12.29 |
(R1)제14강(0.0) R 응용(1) 목차 - 군집분석,KNN,의사결정나무,NaiveBayes, ... (0) | 2020.07.15 |