- Niğde Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi
- Vol: 12 Issue: 2
- Türkçe sosyal medya mesajlarından kullanıcıların yaş ve cinsiyetini tahmin etme
Türkçe sosyal medya mesajlarından kullanıcıların yaş ve cinsiyetini tahmin etme
Authors : Mustafa Kaan Görgün, Gökçe Başak Demirok, Mucahid Kutlu
Pages : 325-333
Doi:10.28948/ngumuh.1191719
View : 6 | Download : 2
Publication Date : 2023-04-15
Article Type : Research
Abstract :Sosyal medya platformları insanların herhangi bir konu hakkındaki fikirlerine dair çok yüksek miktarda veri sunmaktadır. Bu yüzden, bu tip platformlar market analizi ve toplumsal görüş tahmini gibi birçok çalışma için çok önemli veri kaynaklarıdır. Ancak, sosyal medya kullanıcıları bir toplumu tam anlamıyla yansıtmadığından ötürü sosyal medya verisindeki yanlılığı azaltmak için kullanıcıların yaşı ve cinsiyeti gibi çeşitli bilgileri de göz önünde bulundurarak sayma işlemi gibi ek adımların atılması gerekmektedir. Bu çalışmada verilen bir Türkçe Twitter hesabının paylaştığı mesajları kullanarak hesap sahibinin yaş aralığını ve cinsiyetini tahmin etme problemi konusunu ele aldık. Çalışma kapsamında 1040 Twitter kullanıcısının yaş ve cinsiyet bilgilerinden oluşan etiketli bir veri kümesi hazırlanmıştır. Ardından kelime, karakter, retweet, fastText ve BERT tabanlı beş farklı yöntem geliştirilmiştir. Yaptığımız kapsamlı deneylerden kullanıcıların paylaştıkları mesajların insanların yaş ve cinsiyet bilgisine dair önemli ipuçları sunduğunu göstermektedir.Keywords : Doğal Dil İşleme, Yaş Tahmini, Cinsiyet Tahmini, Yazar Profili Tahmini