728x90
05.의사결정트리(Decision Tree) in R (2)
iris 데이터 셋을 이용하여, Training Set과 Test Set을 생성한 뒤, Training Set으로 분류모델을 생성하고, Test Set을 이용하여 분류모델을 평가 해보겠습니다.
먼저 전체 소스입니다.
다음은 iris_ctree결과입니다.
결과를 보시면 Species결정에 Petal.Length와 Petal.Width가 중요한 변수라는걸 알 수 있습니다.
다음은 Iris_ctree를 시각화한 그림입니다.
다음은 stats패키지에서 제공하는 predict()함수로 정확도를 구하는 방법입니다.
pred <- predict(iris_ctree,Test_set) 를 통하여 예측치를 구한뒤
table(pred,Test_set$Species)로 혼돈 매트릭스를 생성한뒤 정확도를 계산합니다.
저의 경우에는 97.8%의 정확도가 나왔으며, sample에 따라 결과의 차이는 약간 있을수 있습니다.
set.seed()를 사용하면 매번 동일결과를 얻을 수 있습니다.
'딥러닝 스터디' 카테고리의 다른 글
07.군집분석(k-means) in R (0) | 2017.06.18 |
---|---|
06.랜덤포레스트(RandomForest) in R (0) | 2017.06.10 |
04.의사결정트리(Decision Tree) in R (1) (0) | 2017.04.15 |
03. 의사결정트리(Decision Tree) 란? (0) | 2017.03.19 |
02.데이터마이닝(Data Mining)기법 (0) | 2017.03.08 |