- Erciyes Üniversitesi Fen Bilimleri Enstitüsü Dergisi
- Vol: 30 Issue: 1
- Bölümleyici kümeleme algoritmalarının farklı veri yoğunluklarında karşılaştırılması
Bölümleyici kümeleme algoritmalarının farklı veri yoğunluklarında karşılaştırılması
Authors : Hüssein Ridha Ali Alzand, Hacer Karacan
Pages : 56-62
View : 9 | Download : 3
Publication Date : 2014-02-01
Article Type : Other
Abstract :Teknolojinin yaygın kullanılmasının neticesinde hacmi her geçen gün artan büyük veri yığınları ortaya çıkmaya başlamıştır . Bu k adar büyük boyutta verinin analizi ve içindeki herhangi bir bilgiye ulaşmak basit inceleme yöntemleriyle oldukça zor olduğundan veri madenciliği devreye girmiştir . Veri madenciliği , çok büyük veri tabanlarından , önceden bilinemeyen , geçerli ve kullanılabilir bilginin çıkarılma işlemi olarak ifade edilmektedir . Başka bir deyişle veri madenciliği , çok büyük veri tabanlarındaki ya da veri ambarlarındaki veriler arasında bulunan ilişkiler , örüntüler , değişiklikler , sa pma ve eğilimler , belirli yapılar gibi ilginç bilgilerin ortaya çıkarılması işlemidir . Veri madenciliği alanında son zamanlarda yaygın bir şekilde kullanılan yöntemlerden biri kümeleme yöntemidir. Kümeleme, veri kümesi ndeki bilgileri farklı kümelere ayırarak küme içindeki verilerin özelliklerinin benzerlik oranı minimum ve kümeler arasında benzerlik oranını maksimum yapmaktadır. Bu çalışmada bölümleyici kümeleme yöntemleri ele alınarak farklı dağılımlı veri setleri üzerinde bölümleyici kümeleme algoritmalarının karşılaştırması gerçekleştirilmiştir. Bölümleyici kümeleme algoritmaları arasından " k - ortalama " ve " çekirdek k - ortalama " algoritmaları seçilmiştir. Farklı dağılımlı veri setlerini kümeleyerek iki algoritmanın hızı, küm eleme kalitesi ve bellek kaplaması açısından bilgiler elde edilmiş ve bu bilgiler ışığında iki algoritmanın karşılaştırma sonuçları sunulmuştur.Keywords : kümeleme algoritmaları, kümeleme analizi