- Mehmet Akif Ersoy Üniversitesi Uygulamalı Bilimler Dergisi
- Vol: 2 Issue: 2
- Comparison of Different Normalization Techniques on Speakers’ Gender Detection
Comparison of Different Normalization Techniques on Speakers’ Gender Detection
Authors : Serhat Ileri, Armağan Karabina, Erdal Kiliç
Pages : 1-12
Doi:10.31200/makuubd.410625
View : 6 | Download : 4
Publication Date : 2018-09-30
Article Type : Other
Abstract :Bu çalışmada Kısa-zaman Ortalama ve Değişinti Normalizasyonu (Short-time Mean and Variance Normalization - STMVN), Kısa-zaman Sepstral Ortalama ve Ölçeklendirme Normalizasyonu (Short-time Cepstral Mean and Scale Normalization - STMSN), Asgari – Azami (Min-Max) Normalizasyonu, Z-Skor (Z-Score) Normalizasyonu ve Standart Sapma (Standard Deviation) Normalizasyon tekniklerinin, konuşmacı cinsiyetinin tespitinde sınıflandırma başarımına etkisi araştırılmıştır. Çalışmada veri seti olarak TIMIT veri setindeki 192 erkek ve 192 kadın konuşmacıya ait ses kayıtları kullanılmıştır. Ses kayıtlarından Mel Frekansı Sepstral Katsayısı (Mel Frequency Cepstral Coefficient – MFCC) tekniği ile öznitelik çıkarılmış ve çıkarılan özniteliklerin boyutu Temel Bileşen Analizi (Principal component analysis – PCA) ile indirgenerek, değişik teknikler ile normalize edilmiştir. Sınıflandırıcı olarak Destek Vektör Makinesi (Support Vector Machine – SVM) kullanılmıştır. Çalışma sonucunda konuşmacı cinsiyeti tahmininde en yüksek başarımın %98.18 ile Standart Sapma Normalizasyon Tekniği ile normalize edilmiş özniteliklerden elde edildiği gözlemlenmiş olup diğer tekniklerin başarımı düşürdüğü gözlemlenmiştir.Keywords : Asgari – Azami Normalizasyonu, Z-Skor Normalizasyonu, Standart Sapma Normalizasyonu, Kısa-zaman Ortalama ve Değişinti Normalizasyonu, Kısa-zaman Sepstral Ortalama ve Ölçeklendirme Normalizasyonu