- International Periodical of Recent Technologies in Applied Engineering
- Vol: 1 Issue: 2
- Türkçe Metinlerde Sözlük Tabanli Yaklaşimla Duygu Analizi Ve Görselleştirme
Türkçe Metinlerde Sözlük Tabanli Yaklaşimla Duygu Analizi Ve Görselleştirme
Authors : Önder Demir, Abdoulaye Issa Baban Chawai, Buket Doğan
Pages : 58-66
View : 22 | Download : 14
Publication Date : 2019-12-31
Article Type : Research
Abstract :Metin madenciliği yöntemleri, yapılandırılmamış metinlerden otomatik olarak faydalı bilgilerin çıkarılmasını kolaylaştırmak için önem kazanmaktadır. Bu amaçla kullanılan metin madenciliği yöntemleri ile büyük miktardaki metin verileri, kısa zamanda ve yüksek performans ile analiz edilebilmektedir. Bu çalışmanın temel amacı, kelime sıklığı, bilgi çıkarma, sınıflandırma, veri işleme ve çıkarma gibi araçlarla Türkçe metinlerinin işlenmesi ve görselleştirilmesidir. Metin madenciliği alanlarından biri olan duygu analizi veya fikir madenciliği, görüşler, tutumlar ve duygular gibi öznel bilgilerin algılanmasını otomatikleştirmek için kullanılmaktadır. Bu tezde sunulan çalışmada, sosyal medya paylaşımları, roman, müşteri yorumları gibi Türkçe metinlerin analizine ihtiyaç duyulduğu durumlarda kullanılabilecek yeni bir araç önerilmektedir. Geliştirilen uygulama esas olarak duygu analizi yaparken "kelime düzeyinde" çalışmaktadır. Buna ek olarak, duygu analizinde kullanılan sözlük sıfatlar, isimler, fiiller, zarflar, ön ekler, son ekler türünde kelimeler içermektedir. Kullanılan birinci sözlük 5.000 kelime, ikinci ve üçüncü sözlük yaklaşık 25.000 kelime içermektedir. Geliştirilen iki yöntemle üç farklı veri seti üzerinde deneyler yapılmıştır. Birinci yöntem bu veri setlerinde sırasıyla %77,14, %72,78 ve %74,17 doğruluk oranına ulaşmıştır. İkinci yöntem ise aynı veri setleri üzerinde sırasıyla %82,85, %74,92 ve %77,50 doğruluk oranına erişmiştir. Yapılan deneysel çalışmaların sonuçları incelendiğinde sistemin hatalı karar verdiği cümleler incelendiğinde hatalı yazılan kelimeler, kinayeli yorumlar, art niyetli yazılmış yorumlar, bazı deyimlerin ve kelimelerin birden fazla anlamının olması, karşılaştırma içeren cümlelerin bir taraf için olumlu duygu taşırken diğer taraf için olumsuz duygu taşıması gibi durumların hatalı tespit işleminde etkin olduğu gözlemlenmiştir. Bu çalışmanın temel amacı, kelime sıklığı, bilgi çıkarma, sınıflandırma, makine öğrenmesi, veri işleme ve çıkarma gibi araçlarla Türkçe metinlerinin işlenmesi ve görselleştirilmesidir.Keywords : Text mining, sentiment analysis, Text classification, Machine learning, Document classification