Veri Madenciliği Uygulamalarında Özellik Seçimi İçin Finansal Değerlere Binning ve Five Number Summary Metotları ile Normalizasyon İşleminin Uygulanması
Abstract :Normalizasyon işlemi veri madenciliği konusunda önemli bir yer teşkil etmektedir. Makine öğrenmesi için gerekli olan farklı sınıflandırma ölçütlerinin birbirlerine karşı başarımlarının belirlenebilmesi için, gerçekleştirilecek uygulamalardan önce veri setinde performans üzerinde doğrudan etkisi olan özelliklerin belirlenmesi, nihai sonuç üzerinde etkisi olmayan ya da minimum etkiye sahip özelliklerin ortaya çıkarılması için özellik seçimi “Feaute Selection” teknikleri kullanılır. Bu teknikler kullanılarak veri setindeki gerekli özelliklerin kullanılması ve doğru sonuçlara ulaşılması amaçlanmaktadır. Değişkenlerin ortalama ve varyansları birbirlerinden önemli ölçüde farklı olduğu taktirde büyük ortalama ve varyansa sahip değişkenlerin diğerleri üzerindeki baskısı daha fazla olur ve onların rollerini önemli ölçüde azaltır. Bu yüzden veri üzerinde normalizasyon işlemi yapılmalıdır. Binning ve Five Number Summary yöntemleri ile normalizasyon işlemleri yapılmıştır. Ve bu metotlardan elde edilen sonuçlar karşılaştırılarak hangi metodun daha uygun olduğu gözlemlenmeye çalışılmıştır. Keywords : Veri Madenciliği, Özellik Seçimi, Veri Normalizasyonu, Binning Metot, Five Number Summary Metot