- Sinop Üniversitesi Fen Bilimleri Dergisi
- Vol: 3 Issue: 2
- Olasılıksal Yöntemler ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi
Olasılıksal Yöntemler ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi
Authors : Engin YILDIZTEPE, Volkan Uzun
Pages : 66-78
Doi:10.33484/sinopfbd.350445
View : 13 | Download : 2
Publication Date : 2018-12-28
Article Type : Research
Abstract :Metin madenciliğinde, yapısal olmayan metin verilerinden matematiksel ve istatistiksel yöntemler ile anlamlı bilgiler çıkartmak amaçlanır. Metin sınıflama, kümeleme, görüş belirleme, özetleme, anlamsal benzerlik bulma ve yazar tanıma, başlıca metin madenciliği çalışma alanlarıdır. Bu çalışmanın konusu olan anlamsal benzerlik analizi, metinler arasındaki anlamsal yakınlığı belirlemeye çalışır. Olasılıksal gizli anlam analizi ve gizli Dirichlet ataması, metinler arasındaki anlamsal benzerliğin belirlenmesinde kullanılan olasılıksal yöntemlerdir. Bu çalışmada olasılıksal gizli anlam analizi ve gizli Dirichlet ataması ile anlamsal benzerlik konusu incelenmiş ve farklı haber ajanslarından seçilen Türkçe metinleri anlamsal benzerliklerine göre sınıflamak için yapılan uygulama tartışılmıştır. Uygulamada R istatistiksel programlama dili ve Matlab kullanılmıştır.Keywords : Anlamsal benzerlik, Gizli anlam analizi, Gizli Dirichlet ataması, Metin madenciliği