Yayın:
Gauss karışım modeli̇ ile konuşmacı tanımada parametre değerlilerinin seçi̇mi̇

Placeholder

Tarih

Akademik Birimler

Kurum Yazarları

Eskidere, Ömer
Ertaş, Figen

Yazarlar

Danışman

Dil

Yayıncı:

IEEE

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Özet

Bu makalede, konuşmaların hem temiz (TIMIT) hem de telefon ortamından iletildiği (NTIMIT) iki veritabanı için, Gauss karışımındaki bileşen sayısı, eğitim süresi, test süresi, ve kişi sayısı değişimlerinin konuşmacı tanımaya etkisi incelenmiştir. Bulunan en iyi parametreler ile TIMIT veritabanı için %100, NTIMIT veritabanı için % 85.71 konuşmacı tanıma oranı elde edilmiştir.
In this paper, the impact of the number of Gaussian mixtures, the duration of training and testing sessions, and the number of speakers on speaker identification has been investigated using clean speech (TIMIT) and telephone speech (NTIMIT) databases. Employing the parameters that provide the maximum performance, 100% and 85.71% identification rates have been obtained for the TIMIT and NTIMIT databases, respectively.

Açıklama

Bu çalışma, 11-13, Haziran 2007 tarihlerinde Eskişehir[Türkiye]’de düzenlenen IEEE 15. Signal Processing and Communications Applications Conference Kongresi‘nde bildiri olarak sunulmuştur.

Kaynak:

Anahtar Kelimeler:

Konusu

Computer Science, Telecommunications, Engineering, Clean speech, Gaussian mixture model, Training and testing, Gaussian mixtures, Telephone speech, Identification rates, Speaker identification, Parameter settings, Identification (control systems), Database systems, Trellis codes, Impact testing, Speech recognition, Loudspeakers, Signal processing, Speech, Bileşen sayısı, Veri taban

Alıntı

Eskidere, Ö. ve Ertaş, F. (2007). "Gauss karışım modeli̇ ile konuşmacı tanımada parametre değerlilerinin seçi̇mi̇". 2007 IEEE 15. Signal Processing and Communications Applications, SIU, 1-3, 495.

Endorsement

Review

Supplemented By

Referenced By

0

Views

0

Downloads

View PlumX Details