- International Journal of Pure and Applied Sciences
- Vol: 8 Issue: 1
- Machine Learning Based Deception Detection System in Online Social Networks
Machine Learning Based Deception Detection System in Online Social Networks
Authors : Harun Bingol, Bilal Alatas
Pages : 31-42
Doi:10.29132/ijpas.994840
View : 6 | Download : 3
Publication Date : 2022-06-30
Article Type : Research
Abstract :İnternet teknolojilerinin hızla yaygınlaşması, insanların bilgiye erişim açısından yaşamlarını kolaylaştırmaktadır. Ancak internetin bu olumlu yönlerine ilaveten olumsuz etkileride göz ardı edilemez. Bunların en önemlisi ise sosyal medya üzerinden güvenilirliği tartışmalı olan bilgiye erişmek isteyen insanların aldatılmasıdır. Aldatma, genel olarak insanların belirli bir konuda düşüncelerini yönlendirmeyi ve belirli bir amaca yönelik toplumsal bir algı oluşturmayı amaçlar. Bu fenomenin tespiti, sosyal ağları kullanan insan sayısındaki muazzam artış nedeniyle giderek daha önemli hale geliyor. Bazı araştırmacılar son zamanlarda aldatma tespiti problemini çözmek için teknikler önermiş olsa da, farklı değerlendirme ölçütleri açısından yüksek performanslı sistemler tasarlamaya ve kullanmaya ihtiyaç vardır. Bu çalışmada, çevrimiçi sosyal ağlarda aldatma tespiti problemi bir sınıflandırma problemi olarak modellenmiş ve metin madenciliği ve makine öğrenmesi algoritmaları kullanılarak sosyal ağlardaki yanıltıcı içerikleri tespit eden bir metodoloji önerilmiştir. Bu yöntemde içerik metin tabanlı olduğu için metin madenciliği işlemleri yapılmakta ve yapılandırılmamış veri kümeleri yapılandırılmış veri kümelerine dönüştürülmektedir. Ardından denetimli makine öğrenmesi algoritmaları uyarlanmata ve yapılandırılmış veri kümelerine uygulanmaktadır. Bu çalışmada, gerçek halka açık veri setleri kullanılmış ve Destek Vektör Makinesi, k-Nearest Neighbor (k-NN), Naive Bayes (NB), Random Forest, Decision Trees, Gradient Boosted Trees (GBT) ve Logistic Regresyon algoritmaları birçok farklı metrik açısından karşılaştırılmıştır. Veri seti 1’de en yüksek ortalama doğruluk değerini %74.4 GBT algoritmasında elde edilirken, Veri seti 2’de en yüksek ortalama doğruluk değeri %71.2 ile NB algoritmasından elde edilmiştir.Keywords : Sınıflandırma, Aldatma Tespiti, Makine Öğrenmesi, Sosyal Ağlar