- Fırat Üniversitesi Fen Bilimleri Dergisi
- Vol: 34 Issue: 1
- Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olara...
Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olarak Google Colab Platformunda ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi
Authors : Engin Demir, Abdülkadir Tepecik
Pages : 19-29
View : 7 | Download : 3
Publication Date : 2022-03-27
Article Type : Research
Abstract :Duygu, insanın ruh halinde içsel ve çevresindeki etkilerle etkileşiminden doğan fiziksel değişimlerdir. Bireyler duygularını, beden dilinin yanı sıra sesli iletişim vasıtalarıyla da diğer bireylere aktarabilirler. Özellikle beden dilinin yetersiz olduğu durum ve zamanlarda bireyler için sesli iletişim önem kazanmaktadır. Çalışmamızda da Türkçe ses kayıtlarını içeren veri seti üzerinde Pyhton programlama dili aracılığıyla öncelikle verilerin duygu etiketlerinin tespiti yapılmış olup, sonrasında literatür çalışmalarında en çok kullanılan beş makine öğrenim algoritmasıyla analizler gerçekleştirilmiştir. Analizler hem Rapid Miner hem de Pyhton programlama dili aracılığıyla gerçekleştirilmiştir. Çalışmada, Pyhton programlama dili aracılığıyla yapılan analizlerde hem CountVectorizer hem de TF-IDF vektörizasyon yöntemleri, Rapid Miner ile yapılan analizlerde TF-IDF vektörizasyon yöntemi kullanılmıştır. Sonuç kısmında ise Pyhton programlama dilinde en iyi doğruluk oranını %70 oranla Naive Bayes makine öğrenim algoritması CountVectorizer yöntemiyle elde etmiştir. Rapid Miner’da ise en iyi doğruluk oranını %69,60 oranla Support Vector Machine makine öğrenim algoritması elde etmiştir. Çalışmamızla beraber ortaya yeni bir Türkçe duygu veri seti çıkmıştır. Çalışmamız ayrıca Türkçe ses kayıtlarından elde edilen verilerin BERT modeli ile duygu tespiti yapılan özgün bir çalışmadır.Keywords : Duygu Analizi, Türkçe Ses Kayıtları, Türkçe Duygu Analizi, Rapid Miner, Pyhton.