본문 바로가기

rpart3

(R3)제04강(1.1) 의사결정나무 - iris, rpart, caret 가장 많이 알려져 있는 데이터인 붓꽃 데이터(iris)를 이용하여 의사결정트리를 실행합니다. 사용되는 패키지는 {rpart} 이고, 사용되는 함수도 rpart()입니다. 뒷부분에 모형 평가를 위해 패키지 caret 사용법을 추가했습니다. 1. 의사결정나무 실행 - 패키지 rpart 이용 install.packages("rpart") # 패키지 rpart 설치 library(rpart) # 패키지 rpart 로딩 rpart(Species ~., data=iris) # 종속변수 붓꽃의 종류 Species로 하고, 나머지 변수로 의사결정모형을 실행 plot(model_rpa,compress=T,margin=0.2) # 의사결정모형의 결과를 Plot text(model_rpa, cex=1.5) # [[ 해석 ].. 2020. 12. 29.
(R1)제14강(3.1)의사결정나무 - 데이터(iris), 패키지(rpart) 가장 많이 알려져 있는 데이터인 붓꽃 데이터(iris)를 이용하여 의사결정트리를 실행합니다. 사용되는 패키지는 {rpart} 이고, 사용되는 함수도 rpart()입니다. 뒷부분에 모형 평가를 위해 패키지 caret 사용법을 추가했습니다. 1. 의사결정나무 실행 - 패키지 rpart 이용 install.packages("rpart") # 패키지 rpart 설치 library(rpart) # 패키지 rpart 로딩 rpart(Species ~., data=iris) # 종속변수 붓꽃의 종류 Species로 하고, 나머지 변수로 의사결정모형을 실행 plot(model_rpa,compress=T,margin=0.2) # 의사결정모형의 결과를 Plot text(model_rpa, cex=1.5) # [[ 해석 ].. 2020. 12. 29.
4.1 의사결정나무 - 회귀(regression) 나무, 분류(classification)나무 의사결정나무는 회귀문제와 분류문제에 적용할 수 있습니다. 회귀문제는 회귀분석 같이 연속적인 변수에 대한 예측을 하는 것이고 분류문제는 판별분석 같이 어느 부류에 속하는 것인가를 예측하는 것입니다. 분류문제는 붓꽃(iris)의 데이터를 이용하여 진행하겠습니다. 붓꽃(iris) 데이터는 이름 그대로 붓꽃의 데이터인데 3종류(species)가 있습니다. Setosa, VIrginica, Versicolor 세 종류입니다. 각 종류마다 50개의 데이터가 있으니 전체 데이터 갯수는 150개 입니다. 각 관측치(붓꽃)마다 꽃받침(Sepal)의 길이와 폭 꽃잎(Petal)의 길이와 폭 4개의 변수가 있습니다. 즉 4개의 변수와 분류를 나타낸는 1개의 변수, 모두 5개의 변수로 구성됩니다. 분류트리의 예 다음은 분류트.. 2020. 8. 23.