Türkçe için Wikipedia Tabanlı Varlık İsmi Tanıma Sistemi
Authors : Doğan KÜÇÜK, Nursal ARICI
Pages : 325-332
View : 10 | Download : 4
Publication Date : 2016-09-01
Article Type : Research
Abstract :Varlık ismi tanıma, doğal dil işleme araştırma alanında bir problemdir ve genellikle doğal dildeki metinlerden kişi, yer ve kurum isimlerinin otomatik çıkarılması olarak tanımlanmaktadır. Bu çalışmada, Türkçe için geliştirdiğimiz Wikipedia tabanlı bir varlık ismi tanıma sistemi tanıtılmıştır. Wikipedia gibi internet kullanıcıları tarafından oluşturulan kaynakların varlık ismi tanıma gibi konular için oldukça faydalı oldukları bilinmektedir. Öncelikle, Türkçe Wikipedia’dan otomatik olarak geniş bir insan ismi listesi derlenmiştir. Daha sonra, bu liste ile birlikte yine Türkçe Wikipedia’dan ve Türkçe için kural-tabanlı bir sistemden elde edilmiş kişi, yer ve kurum ismi listelerini de kullanarak Türkçe için Wikipedia-tabanlı bir varlık ismi tanıma sistemi geliştirilmiştir. Sistemimiz değişik veri kümeleri üzerinde test edilerek değerlendirilmiş ve umut verici sonuçlar elde edilmiştir. Türkçe metinlerde bilgi çıkarımı üzerinde yapılmış kısıtlı sayıda çalışma olduğundan bizim sistemimiz bu konuda önemli bir katkı teşkil etmektedir.Keywords : Varlık ismi tanıma, bilgi çıkarımı, Türkçe, otomatik metin işleme