iris13 4.1 의사결정나무 - 회귀(regression) 나무, 분류(classification)나무 의사결정나무는 회귀문제와 분류문제에 적용할 수 있습니다. 회귀문제는 회귀분석 같이 연속적인 변수에 대한 예측을 하는 것이고 분류문제는 판별분석 같이 어느 부류에 속하는 것인가를 예측하는 것입니다. 분류문제는 붓꽃(iris)의 데이터를 이용하여 진행하겠습니다. 붓꽃(iris) 데이터는 이름 그대로 붓꽃의 데이터인데 3종류(species)가 있습니다. Setosa, VIrginica, Versicolor 세 종류입니다. 각 종류마다 50개의 데이터가 있으니 전체 데이터 갯수는 150개 입니다. 각 관측치(붓꽃)마다 꽃받침(Sepal)의 길이와 폭 꽃잎(Petal)의 길이와 폭 4개의 변수가 있습니다. 즉 4개의 변수와 분류를 나타낸는 1개의 변수, 모두 5개의 변수로 구성됩니다. 분류트리의 예 다음은 분류트.. 2020. 8. 23. 이전 1 2 3 다음