Mel frekansı kepstrum katsayılarındaki değişimlerin konuşmacı tanımaya etkisi

Loading...
Thumbnail Image

Date

2009

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Uludağ Üniversitesi

Abstract

Konuşmacıya özgü bilgileri karakterize eden özniteliklerin çıkartılması, konuşmacı tanıma sisteminin performansı için hayati öneme sahiptir. Bu makalede, TIMIT ve NTIMIT veritabanları kullanılarak öznitelik vektörü oluşturma aşamalarının her biri için parametre değişiminin konuşmacı tanımaya etkisi incelenmekte ve tanımayı arttırıcı en iyi parametre değerleri bulunmaktadır. Bu veritabanları ile yapılacak diğer konuşmacı tanıma çalışmaları için, kaynak olabilecek optimum öznitelik değerleri belirlenmiştir. Bu sayede diğer araştırmacıların, en iyi parametreleri bulmak için tekrar deney yapmalarına gerek kalmayacaktır.
Extraction of speaker-specific features which characterize the information towards identification of the correct speaker is vital importance. In this work TIMIT and NTIMIT databases are used. The effect of changing the feature vector elements to the speaker identification is analyzed and the best identifying elements are found. The best identifying feature vector elements may also be used for other speaker identification studies using the same databases. This way, any future work using these databases may not need to optimize the feature vectors towards identification.

Description

Keywords

Mel frekansı kepstrum katsayıları, Konuşmacı tanıma, Gauss karışım modeli, TIMIT/NTIMIT veritabanları, Mel frequency cepstrum coefficients, Speaker identification, Gaussian mixture model, TIMIT/NTIMIT databases

Citation

Eskidere, Ö. ve Ertaş, F. (2009). "Mel frekansı kepstrum katsayılarındaki değişimlerin konuşmacı tanımaya etkisi". Uludağ Üniversitesi Mühendislik-Mimarlık Fakültesi Dergisi, 14(2), 93-110.