Knime ile Örnek Çalışma – Iris Örneği

AMAÇ: İris adında bir çiçek var ve bu çiçek 3 türdedir; “irissetosa, irisversicolor, irisvirginica.” Kamera bu çiçeğin fotoğrafını çekecek, bu fotoğrafta da çiçeğin kanatlarını ölçecek.  Bunun hangi tür iris çiçeği olduğunu söyleyecek. Acaba fotoğraf çekerek makineye bu çiçeği tanıtabilir miyiz?

Bu yazımızda problemin çözümünü sizlere görseller ve bilgilerle anlatımını gerçekleştireceğiz. Yukarıdaki görmüş olduğunuz şema çözümün son halidir. Hadi şimdi hep birlikte aşama aşama ilerleyelim.

File Reader ekle >> Çift tıkla >> Dosya yolunu seç >> iris.data seç >> OK >> Sağ Tuş execute

Bu verilerden, histogram, color, scatter plot kullanıp, karar ağacı yapıp, scorer ile son olarak başarısını bulup sonuçlarını yazacağız.

Histogram ekleyelim ve biraz inceleyelim;

Column kısmından çiçek türünü incelemeye alırsak; 3 tür çiçek çeşidi olduğunu rahatlıkla görebiliyoruz; iris-setosa = 50 adet, iris-versicolor = 50 adet, iris-verginica = 50 adet

 

Yine column kısmından çanak yaprak uzunluğunu incelersek;
Çanak yaprak uzunluğu; 4-4,782 arasında  = 11 adet,
4,782-5,564 arasında 48 adet,
5,564-646 arasında = 49 adet,
6,346 – 7,128 arasında = 31 adet,
7,128 – 7,91 arasında = 11 adet çiçek bulunmaktadır.
Çanak uzunluğu 4,782 ile 6,346 arasında olan çiçek türü diğerlerine göre fazlaca olduğunu histogram üzerinde görüyoruz.

 

 

Scatter plot ekle >> Color managera bağla >> Sağ tuş execute and open views

Çanak yaprak uzunluğu 1-2 arasında ve taç yaprak uzunluğu 4,3 ile 5,8 arasında olan çiçek = iris setosa olarak görülmektedir.
Çanak yaprak uzunluğu 3 ile 4,5 arasında olup taç yaprak uzunluğu 4,9 ile 6,7 arasında olan çiçek yüksek ihtimalle  iris-versicolor olarak görülmektedir.

 

Çanak yaprak uzunluğu 3 ile 4,5 arasında olup taç yaprak uzunluğu 4,9 ile 6,7 arasında olan çiçek yüksek ihtimalle iris-versicolor olarak görünmektedir.

Yine benzer şekilde diğer verileri de karşılaştırarak yorum yapabiliriz ya da bir anlam çıkartabiliriz.
Şimdi Knime’da karar ağacı ile problemimizi inceleyelim;

Karar ağacında da görmüş olduğumuz üzere 3 çeşit iris çiçek türü vardır. Makine tarafından çiçeğin türünü belirleyen en önemli faktör = taç yaprak genişliğidir. Taç yaprak genişliği 0,7den küçük veya eşitse bu çiçek türü %100 iris-setosadır.

Taç yaprak genişliği 0,7’nin üzerinde ise iris versicolor ya da iris-virginica’dır. %52,2 ile virginica olma ihtimali daha yüksek gözükmektedir. Burada ise bunu belirleyen en önemli faktör yine taç yaprak genişliğidir.

Taç yaprak genişliği 1,75’in üzerinde ise %97,1 oranda iris virginicadır. 1,75’e eşit veya altındaysa %91,4 ile versicolordur.

Toparlamak gerekirse, ilk aşamada çiçeğin türünü belirleyen en önemli faktör taç yaprak genişliğidir. Taç yaprak genişliği 0,7’ye eşit veya altındaysa iris-setosadır. Taç yaprak genişliği 0,7ile 1,75 arasında ise bu çiçek türü iris-versicolordur, 1,75’ten fazla ise bu çiçek türü iris-virginica’dır.

Bu ölçümde %95,5 oranında başarı sağlanmıştır. Hata oranı = %4,44’tür
Iris-setosa ve iris-versicolor tahmini %100 doğru olarak karşımıza çıkmaktadır.  Tahminde ise 2 adet yanılma ile iris-virginica türünde görülmektedir.