- Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi
- Vol: 5 Issue: 2 - Vol: 5 Issue: 2
- Türkçe Dokümanlar İçin Kural Tabanlı Varlık İsmi Tanıma
Türkçe Dokümanlar İçin Kural Tabanlı Varlık İsmi Tanıma
Authors : Zeynep Banu Özger, Banu Diri
Pages : 0-0
View : 6 | Download : 2
Publication Date : 2016-06-24
Article Type : Research
Abstract :Varlık İsmi Tanıma, Doğal Dil İşleme biliminin çalışma alanlarından biri olup, dokümanlarda geçen varlık isimlerini kişi, yer ve organizasyon olarak ayırmanın yanı sıra formül, tarih ve parasal ifadeleri de bulabilmeyi hedefleyen, son yıllarda farklı dillerde çalışmaların devam ettiği bir alandır. Kural Tabanlı Varlık İsmi Tanıma ise, birtakım sözlüksel kaynaklar ile kurallar oluşturup, yüksek doğrulukla Varlık İsmi Tanıma işleminin gerçeklenmesidir.Bu makalede farklı doküman türleri için tasarlanmış, Türkçe Kural Tabanlı bir Varlık İsmi Tanıma çalışmasından bahsedilmektedir. Varlıkları sınıflama ve etiketleme işlemi kişi, kurum ve yer isimleri ile tarih, para ve saat varlıkları olmak üzere toplam 6 farklı tür için gerçekleştirilmiştir. Varlık isimlerinin bulunup etiketlenebilmesi amacıyla her bir varlık türü için küçük boyutlu sözlükler kullanılarak kurallar oluşturulmuştur. Yapılan çalışmanın sonucunda kurum isimlerinden %86, yer isimlerinden %83, kişi isimlerinden ise %84 başarı elde edilmiştir. Sayısal varlık türlerinden ise tarih varlıklarından %92, saat varlıklarından %94 ve para varlıklarından %96 başarı elde edilerek tatmin edici sonuçlar alınmıştır.Keywords : Varlık İsmi Tanıma, Doğal Dil İşleme, Kural Tabanlı, Türkçe