- Iğdır Üniversitesi Fen Bilimleri Enstitüsü Dergisi
- Vol: 10 Issue: 4
- Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması
Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması
Authors : Ahmet Çelik
Pages : 2328-2340
Doi:10.21597/jist.714810
View : 9 | Download : 5
Publication Date : 2020-12-15
Article Type : Research
Abstract :Görüntü formatındaki belgelerin içinden karakterlerin veya verilerinin tekrar metin biçimine dönüştürülmesi büyük zaman ve iş gücü kaybı demektir. Günümüzde doküman işlemlerinde, işlem maliyetlerini düşürmek ve verimlilik oranlarını arttırmak istenilmektedir. Okutulacak belgeler üzerinde farklı yazı stilleri, yazı boyutları ve yazı biçimleri olabilmektedir. Ayrıca el yazısı notları da olabilmektedir. Bilgisayar ortamında hazırlanan ve bilinen yazı stilleriyle oluşturulan karakter değerlerinin tekrar düzenlenebilir metin formatına dönüştürme başarısı daha yüksektir ancak el yazısı karakterlerinin dönüştürme başarısı daha düşüktür. Tesseract kütüphanesinin eğitim verilerinin yeterli olmaması sebebiyle bazı yazı biçimlerinde başarı oranı düşük olabilmektedir. Bu çalışmada; OCR teknolojisi için kullanılan Tesseract kütüphanesi yardımıyla farklı yazı stilleri üzerinde, farklı yazı biçimleri uygulanarak, alfabetik karakter ve rakam okutulması gerçekleştirilmiş ve okuma başarı kıyaslaması yapılmıştır. Times New Roman, Calibri ve Arial yazı stilleri üzerinde normal, kalın ve eğik yazı biçimleri uygulanan örnekler kullanılmıştır. Ayrıca Tesseract kütüphanesi kullanımı öncesi, görüntü üzerinde Error Diffusion (Hata Yayılımı) algoritmaları ile iyileştirmeler yapılarak okuma oranları karşılaştırılmıştır. Böylece OCR tanıma yönteminin başarısını arttıran, ön işlem algoritmasının bulunması amaçlanmıştır. Elde edilen değerlere göre; belge üzerinde ön işlem olarak, Floyd Steinberg hata dağılım algoritması kullanımından sonra Tesseract kütüphanesinin daha doğru okuma yaptığı görülmüştür.Keywords : Optik karakter tanıma, , Tesseract, görüntü işleme, hata yayılımı, makine öğrenmesi