- Veri Bilimi
- Vol: 4 Issue: 1
- Boyut Azaltmanın Bulanık C-Ortalama Kümeleme Teknikleri Üzerindeki Etkisi
Boyut Azaltmanın Bulanık C-Ortalama Kümeleme Teknikleri Üzerindeki Etkisi
Authors : Nuran Peker, Cemalettin Kubat
Pages : 1-7
View : 29 | Download : 11
Publication Date : 2021-01-15
Article Type : Research
Abstract :Bulanık c-ortalama kümeleme, literatürde farklı alanlarda kullanılan yaygın kümeleme algoritmalarından biridir. Boyut küçültme, büyük veri kümelerini, en az bilgi kaybıyla eşdeğeri olan daha küçük boyutlu veri kümelerine dönüştüren bir tekniktir. Bu makalede, boyut azalmasının farklı bulanık kümeleme teknikleri üzerindeki etkisi incelenmektedir. Bu amaçla farklı dört bulanık kümeleme algoritması kullanıldı: Bulanık C-Ortalamalar (BCO), Tip-2 Bulanık C-Ortalamalar (BCO2), Olasılıksal Bulanık C-Ortalamalar (OBCO) ve Denetimsiz Olasılıksal Bulanık C-Ortalamalar (DOBC). Boyut küçültme için verilerdeki varyansı minimum %80 açıklayan bir dizi bileşen seçildi. Boyutsallığın azaltılması için Kesik Tekil Değer Ayrıştırma (KTDA) tekniği kullanıldı. Çalışmada, ilk olarak, orijinal gerçek dünya veri kümeleri, bahsedilen dört yöntemle kümelendi. Daha sonra, bu veri kümelerinin boyutu küçültülmüş hali de yine bu dört yöntemle kümelendi. Kümeleme performansı için dört dahili kümeleme değerlendirme metriği kullanıldı. Bunlar Silhouette İndeksi (SI), Bölme Katsayısı (BK), Bölme Entropisi (BE) ve Kök Ortalama Kare Hatası (KOKH). Yöntemlerin, orijinal ve boyutu azaltılmış veri kümeleri için kümeleme performansı, karşılaştırmalı olarak sunulmaktadır. Sonuçlara göre, indirgenmiş veriler üzerinde, yöntemlerin performansı orijinal verilerden daha başarılıdır. Boyut azaltımının kümeleme başarısına katkısı en çok BCO için, en az BCO2 için elde edilmektedir.Keywords : Kümeleme, Bulanık C-ortalamalar, KTDA, Boyut azaltma