Yayın: Gauss karışım modeli̇ ile konuşmacı tanımada parametre değerlilerinin seçi̇mi̇
Tarih
Kurum Yazarları
Eskidere, Ömer
Ertaş, Figen
Yazarlar
Danışman
Dil
Türü
Yayıncı:
IEEE
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Özet
Bu makalede, konuşmaların hem temiz (TIMIT) hem de telefon ortamından iletildiği (NTIMIT) iki veritabanı için, Gauss karışımındaki bileşen sayısı, eğitim süresi, test süresi, ve kişi sayısı değişimlerinin konuşmacı tanımaya etkisi incelenmiştir. Bulunan en iyi parametreler ile TIMIT veritabanı için %100, NTIMIT veritabanı için % 85.71 konuşmacı tanıma oranı elde edilmiştir.
In this paper, the impact of the number of Gaussian mixtures, the duration of training and testing sessions, and the number of speakers on speaker identification has been investigated using clean speech (TIMIT) and telephone speech (NTIMIT) databases. Employing the parameters that provide the maximum performance, 100% and 85.71% identification rates have been obtained for the TIMIT and NTIMIT databases, respectively.
In this paper, the impact of the number of Gaussian mixtures, the duration of training and testing sessions, and the number of speakers on speaker identification has been investigated using clean speech (TIMIT) and telephone speech (NTIMIT) databases. Employing the parameters that provide the maximum performance, 100% and 85.71% identification rates have been obtained for the TIMIT and NTIMIT databases, respectively.
Açıklama
Bu çalışma, 11-13, Haziran 2007 tarihlerinde Eskişehir[Türkiye]’de düzenlenen IEEE 15. Signal Processing and Communications Applications Conference Kongresi‘nde bildiri olarak sunulmuştur.
Kaynak:
Anahtar Kelimeler:
Konusu
Computer Science, Telecommunications, Engineering, Clean speech, Gaussian mixture model, Training and testing, Gaussian mixtures, Telephone speech, Identification rates, Speaker identification, Parameter settings, Identification (control systems), Database systems, Trellis codes, Impact testing, Speech recognition, Loudspeakers, Signal processing, Speech, Bileşen sayısı, Veri taban
Alıntı
Eskidere, Ö. ve Ertaş, F. (2007). "Gauss karışım modeli̇ ile konuşmacı tanımada parametre değerlilerinin seçi̇mi̇". 2007 IEEE 15. Signal Processing and Communications Applications, SIU, 1-3, 495.
