- Avrupa Bilim ve Teknoloji Dergisi
- Ejosat Special Issue: (ISMSIT) Special Issue
- A Study of Static and Dynamic Significance Weighting Multipliers on the Pearson Correlation for Coll...
A Study of Static and Dynamic Significance Weighting Multipliers on the Pearson Correlation for Collaborative Filtering
Authors : Savaş Okyay, Sercan Aygün
Pages : 270-275
Doi:10.31590/ejosat.822968
View : 17 | Download : 4
Publication Date : 2020-11-30
Article Type : Research
Abstract :Veri madenciliği ve bilgi keşfinin bir alanı olarak öneri sistemleri, film tavsiye platformları üzerinde muazzam bir etkiye sahiptir. Profilleri göz önünde bulundurarak izleyiciler için uygun tavsiye ölçülebilir bir argümandır. Kullanıcı oylama eylemleri gibi bazı sayısal veri içerisindeki doğrusal kombinasyonları çıkararak istatistiksel analizler yapılabilir. Böylece, film gibi herhangi bir öğe kullanıcıya önerilebilir veya önerilmeyebilir. Korelasyonların sayısal hesaplaması, yani benzerlik ağırlığı, kullanıcı benzerliklerinin etkisini daha fazla sabit çarpımla arttırmak için tahminden önce yeniden hesaplanmalıdır. Bu yöntem, benzerliklerin etkisini vurgulamak için bir adım daha işleyen önem ağırlıklandırması olarak adlandırılır. Kullanıcılar arasındaki yakınlık, ortak oylanan öğelerin toplam sayısı veya daha karmaşık hesaplamalar yapılan başka bir çıkarım olabilir. Bu çalışmada, Pearson Korelasyonu ile ilgili önem ağırlıklandırma yöntemi karşılaştırmalı yaklaşımlar kullanılarak incelenmiştir. Deneylerde hem ML100K hem de ML1M sürümlerini içeren MovieLens veri kümesi kullanılır. k-katlamalı çapraz doğrulama yöntemi, test sayısını artırmak için kaydırmalı tarzda uygulanır. Kullanıcı-kullanıcı benzerlikleri için Pearson Korelasyon Katsayılarını elde ettikten sonra, ağırlıklar üç farklı yaklaşım kullanılarak ifade edilir. Ardından komşular, testteki kullanıcı için en yakın N kullanıcıyı seçmek üzere sıralanır. Deneysel sonuçlarla ilgili olarak, diğer iki tekniğe göre, basitliği ve performansı hesaba katılarak, sadece ortak oylanan öğe sayısını kullanan açık yöntem tercih edilir. Deneysel grafiklerde, doğruluk ve hata ölçümleri üç farklı önem ağırlıklandırma yaklaşımı için sunulmuştur. Özellikle ML100K veri kümesi için, basit ağırlıklandırma yöntemi hata ölçümleri açısından daha iyi performans gösterir.Keywords : İşbirlikçi filtreleme, MovieLens, Pearson benzerliği, Öneri sistemleri, Önem ağırlıklandırma