- Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi
- Vol: 38 Issue: 3
- Mühendislik alanındaki Türkçe akademik metinler için makine öğrenmesi destekli doğal dil işleme çalı...
Mühendislik alanındaki Türkçe akademik metinler için makine öğrenmesi destekli doğal dil işleme çalışmaları ve bir karar destek sisteminin geliştirilmesi: TÜBİTAK projeleri örneği
Authors : Bora Kat
Pages : 1879-1892
Doi:10.17341/gazimmfd.1132053
View : 8 | Download : 2
Publication Date : 2023-01-06
Article Type : Research
Abstract :Makale, bildiri, tez ve proje önerisi gibi akademik metinlerin, gelişen doğal dil işleme araçları ve algoritmaları ile işlenmesi sonucunda elde edilen bilgi farklı amaçlar için kullanılabilmektedir. Mevcut çalışmanın ilk aşamasında, mühendislik alanında kullanılan kelime ve kelime gruplarının içerikleri ve yapıları dikkate alınarak bir kütüphane oluşturulmuş; ilgili metni en uygun ve kapsamlı şekilde tanımlayacak anahtar terimlerin/özniteliklerin çıkarımı gerçekleştirilmiştir. Bu işlem sonucunda elde edilen terim vektörleri kullanılarak farklı dokümanların benzerliğinin tespit edilmesine yönelik bir algoritma geliştirilmiştir. Son olarak ise, gözetimli makine öğrenmesi kapsamında Naïve Bayes sınıflandırıcısı kullanılarak TÜBİTAK Araştırma Destek Programları Başkanlığı’na (ARDEB) sunulan proje önerilerinin 31 farklı mühendislik alt alanından hangisine ait olduğunun tespitine yönelik bir analiz gerçekleştirilmiştir. 1255 proje önerisi ile gerçekleştirilen vaka çalışmasında, önerilen benzerlik algoritmasının revize proje önerilerinin benzerlik tespitinde %100’e yakın, sınıflama algoritmasının ise alt alan belirlemede ilk tahminde %83,3, ilk iki tahminde %92,5 ve ilk üç tahminde %96.4’lük doğruluk sağladığı gözlenmiştir.Keywords : anahtar terim çıkarımı, öznitelik çıkarımı, doğal dil işleme, gözetimli makine öğrenmesi, Naïve Bayes sınıflayıcısı, TÜBİTAK, kavramsal benzerlik