Publication:
Bürünsel özelliklerin konuşmacı tanıma performansına etkisi

dc.contributor.buuauthorEskidere, Ömer
dc.contributor.buuauthorErtaş, Figen
dc.contributor.departmentMühendislik Mimarlık Fakültesi
dc.contributor.departmentMekatronik Programı
dc.date.accessioned2020-08-05T11:56:23Z
dc.date.available2020-08-05T11:56:23Z
dc.date.issued2009
dc.description.abstractBu makalede, bürünsel özniteliklerin gürültü içeren ortamlarda konuşmacı tanıma başarımına etkileri incelenmiştir. Bunun için, formant frekansı, sinyal enerjisi ve perde frekansı bürünsel özellikleri ve mel frekansı kepstrum katsayıları (MFCC) konuşma sinyalinden elde edilmiştir. Daha sonra her bir konuşmacı için özniteliklerin dağılımı Gauss karışım modeli ile modellenmiştir. Konuşmacı tanıma başarımı TIMIT ve NTIMIT veritabanları ile test edilmiştir. Gürültü ortamı NOISEX veritabanı kullanılarak oluşturulmuştur. Deneysel sonuçlar, enerjinin birinci türevi ve formant frekansları oranının (F3/F2), öznitelik vektörleriyle birlikte kullanılmasının konuşmacı tanıma hata oranını azalttığını göstermiştir. Ayrıca perde frekansının, gürültü ve telefon ortamının oluşturduğu bozulmalara karşı gürbüz bir öznitelik olduğu bulunmuştur.
dc.description.abstractIn this paper, the effect of the prosodic features on the performance of the speaker identification system in the noisy environment is investigated. For this purpose, the prosodic features, formant frequency, signal energy and pitch frequency, and mel frequency cepstrum coefficients (MFCC) are extracted from the speech signal. And then the distribution of the features for each speaker is modeled by Gaussian Mixture Model (GMM). The speaker recognition is performed on the TIMIT and NTIMIT databases. The noisy environment is created using the NOISEX database. The experimental results showed that when first derivative of the energy and the ratio of the formant frequencies (F3/F2) are used in feature vector, the speaker identification error rate decreases. It is also founded particularly that the pitch frequency is the robust feature against noise and distortion in the phone lines.
dc.identifier.citationEskidere, Ö. ve Ertaş, F. (2009). "Bürünsel özelliklerin konuşmacı tanıma performansına etkisi". Uludağ Üniversitesi Mühendislik-Mimarlık Fakültesi Dergisi, 14(2), 111-129.
dc.identifier.endpage129
dc.identifier.issn2148-4147
dc.identifier.issue2
dc.identifier.startpage111
dc.identifier.urihttps://dergipark.org.tr/tr/download/article-file/202720
dc.identifier.urihttp://hdl.handle.net/11452/11953
dc.identifier.volume14
dc.language.isotr
dc.publisherUludağ Üniversitesi
dc.relation.journalUludağ Üniversitesi Mühendislik Dergisi / Uludağ University Journal of The Faculty of Engineering
dc.relation.publicationcategoryMakale - Uluslararası Hakemli Dergi
dc.rightsinfo:eu-repo/semantics/openAccess
dc.source.uriAtıf 4.0 Uluslararası
dc.subjectBürünsel özellikler
dc.subjectFormant frekansı
dc.subjectEnerji
dc.subjectPerde frekansı
dc.subjectKonuşmacı tanıma
dc.subjectGauss karışım modeli
dc.subjectProsodic features
dc.subjectFormant frequency
dc.subjectEnergy
dc.subjectPitch frequency
dc.subjectSpeaker identification and Gaussian mixture model
dc.titleBürünsel özelliklerin konuşmacı tanıma performansına etkisi
dc.title.alternativeThe effect of prosodic features on performance speaker identification
dc.typeArticle
dspace.entity.typePublication
local.contributor.departmentTeknik Bilimler Meslek Yüksekokulu/Mekatronik Programı
local.contributor.departmentMühendislik Mimarlık Fakültesi/Elektronik Mühendisliği Bölümü

Files

Original bundle

Now showing 1 - 1 of 1
Thumbnail Image
Name:
14_2_9.pdf
Size:
1011 KB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
Placeholder
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: