- Uluslararası Yönetim Bilişim Sistemleri ve Bilgisayar Bilimleri Dergisi
- Vol: 5 Issue: 1
- COMPONENT ANALYSIS FOR INTERESTING PATTERN DETECTION IN MULTI-VARIABLE DATA SETS
COMPONENT ANALYSIS FOR INTERESTING PATTERN DETECTION IN MULTI-VARIABLE DATA SETS
Authors : Ahmet YÜCEL
Pages : 1-11
Doi:10.33461/uybisbbd.802938
View : 6 | Download : 2
Publication Date : 2021-06-30
Article Type : Research
Abstract :Çağımızın yeni güç kaynağı haline gelen veri kavramı üzerine, son yıllarda büyük gelişmeler elde edilmiştir. Hem kodlama hem de mekanik düzeyde ulaşılan yeni yöntem ve teknikler sayesinde, verinin aktarımı, depolanması ve işlenmesi konusunda muazzam hızlara ulaşılmıştır. Veri aktarımı ve depolama hızlarındaki gelişmeler, dijital platformlardaki en küçük bilgiyi dahi veri olarak depolamayı günlük hayatın doğal bir parçası haline getirmiştir. Aile fotoğraflarından sağlık verilerine, ticari kayıtlardan akademik yayınlara, Twitter'da paylaşılan bir yorumdan Youtube'da paylaşılan bir videoya kadar, hemen her alanda değişik boyutlarda veri anlık olarak depolanmaktadır. Depolanmış verinin içinde bulunan ilginç örüntüler ve açığa çıkarılmayı bekleyen bilgi, veri madenciliğinin temel hedeflerindendir. Veri madenciliği çalışmalarında, veri boyutunun büyüklüğü, karşılaşılan en yüyük sorunlardan biridir. Bu tarz verilerin yapısal hale getirilme süreçlerinin uzunluğu ve sonrasında oluşturulacak bir modelin çalıştırılması sırasında yaşanabilecek sıkışmalar, büyük boyutlu verilerde karşılaşılan sorunlardan bazılarındır. Büyük veri boyutundan kaynaklanan problemlerin üstesinden gelebilmek için birçok boyut indirgeme algoritması geliştirilmiştir. Bu çalışmada, çok değişkenli bir veri üzerine, yeni bir boyut indirgeme yaklaşımı geliştirilmiştir. Bu yaklaşım genel olarak Temel Bileşen Analizine (TBA) dayalı örüntü tanıma adımlarından oluşur. Oluşturulan modeller, birbirlerinden ayrık ve dengeli alt veri kümelerine uygulanmış ve tümü 0.05 anlamlılık düzeyinde anlamlı sonuçlar göstermiştir. Modellerin açıklayıcı performansları; Çoklu R-Kare ölçeğinde [0.819, 0.888]aralığında, ve R-Kare ölçeğinde [0.804, 0.878] aralığında gerçekleşmiştir.Keywords : Temel Bileşen Analizi, Örüntü Tanıma, Çok Değişkenli Veri Analizi