- Bilişim Teknolojileri Dergisi
- Vol: 11 Issue: 3
- TBMM Genel Kurul Tutanaklarından Yakın Anlamlı Kavramların Çıkarılması
TBMM Genel Kurul Tutanaklarından Yakın Anlamlı Kavramların Çıkarılması
Authors : Hüseyin Polat, Mesut Körpe
Pages : 235-244
Doi:10.17671/gazibtd.402468
View : 5 | Download : 1
Publication Date : 2018-07-31
Article Type : Research
Abstract :Yakın anlamlı kavramların bulunması, kavramın bir derlemdeki semantik anlamını yakalamamızı ve kavramın hangi bağlamda kullanıldığını elde etmemizi sağlar. Kelime Uzayı Modeli; anlamsal olarak benzer kelimeleri, vektör uzayında bir birine yakın dağılımla gösteren bir modeldir. Her bir kelimenin bir vektörle temsil edildiği bu modelde oluşan kelime vektörleri kelime yerleştirme (Word Embeddings) olarak adlandırılır. Kelime vektörleri metin analizi gerçekleştiren özellikle yapay sinir ağlarını temel alan Doğal Dil İşleme (DDİ) sistemlerinde girdi olarak kullanılır. Bu çalışmada, veri seti olarak TBMM Genel Kurul görüşme tutanakları kullanılmış, Word2vec modeli ve GloVe modeli ile kelime vektörleri çıkarılmıştır. Elde edilen kelime vektörleri kullanılarak TBMM Genel Kurul tutanaklarında geçen herhangi bir kavrama en yakın anlamlı kavramlar bulunmuştur. Literatürdeki benzer çalışmalarda iki farklı kelime yerleştirme modellerinin bir kavramı tamamen farklı bağlamda değerlendirdiği duruma rastlanılmamıştır. Bu çalışma sonucunda, Word2vec ve GloVe modellerinin çıktılarının bir kavramın farklı bağlamlarda kullanımını bulmak için değerlendirilebileceği görülmüştür. Çalışmada derleme özgü analojilerin her iki modelde de bulunabildiği görülmüştür. Bu çalışmadan elde edilen sonuçlar TBMM Genel Kurul tutanaklarınd a arama yaparken benzer kavramların anahtar kelime olarak önerilmesi için kullanılacaktır.Keywords : kelime vektörü, Word2vec modeli, GloVe modeli, sinir ağları, doğal dil işleme