Ses kayıtlarında manipülasyon varlığının tespit edilmesi
Journal Title
Journal ISSN
Volume Title
Uludağ Üniversitesi
Dünyada teknolojinin gelişmesi ile birlikte konuşmacı belirleme ve doğrulama giderek önem kazanmaktadır. Parmak izi ve retina taraması gibi kişiye özgü kimlik bilgisi taşıyan biometrik özelliklere teknolojinin gelişmesi ile ses de eklenmiştir. Ses örneğinden kişinin kimliğinin belirlenmesi güvenlik, telefon bankacılığı, sesli arama gibi alanların yanı sıra adli uygulamalarda da kullanılmaktadır. Adli vakalarda sesin sanılan konuşmacıya ait olup olmadığının belirlenmesinin yanısıra sesin orijinal mi yoksa dijital ortamda oynamalarla mı oluşturulduğunu bilmek de büyük önem arz etmektedir.Bu tezde, NIST2001 veritabanındaki 850 erkek ve 1188 bayan konuşmacının ses örneklerinin Praat yazılım programı yardımı ile perde frekansları konuşma süreleri belirlenen yüzdelerde değiştirilerek ve cinsiyet dönüştürülerek, orijinal ve manipüle edilmiş ses örneklerinin öznitelik vektörleri MFKK (Mel Frekanslı Kepstrum Katsayıları) yöntemiyle hesaplanmıştır. Elde edilen orijinal ve dijital olarak manipüle edilmiş seslerin MFKK öznitelik vektörleri VN (Vektör Nicemleme) ve DVM (Destek Vektör Makineleri) yöntemiyle sınıflandırılmış ve veri tabanındaki orijinal seslerle karşılaştırılarak sistemin değiştirilmiş ses örneklerini tespit edebilme başarısı sınanmıştır.
With the improvement of the technology in the world, the voice identity verification and speaker identification (or speaker recognition) is becoming increasingly important.Voice has also been added to the individual specific biometric features representing the identity of individuals such as commonly employed finger print and retina.Identification of speakers from their voice samples has recently found place particularly in security, telephone banking applications, voice dialing and legal cases. In legal cases, more important is to know voice belong to speaker or created in digital manipulation.In this thesis, pitch frequencies, duration and change gender of 850 male and 1188 female speakers voice samples which are in NIST2001 database have been chanced at particular percentages with software known as Praat. Then feature of original and manipulated voices were calculated by the method of MFCC (Mel Frequency Cepstral Coefficients) and classified by the method of VQ (Vector Quantization) and SVM (Support Vector Machines). The success of system has been tested to detect the manipulated sounds which are in database by comparing.
With the improvement of the technology in the world, the voice identity verification and speaker identification (or speaker recognition) is becoming increasingly important.Voice has also been added to the individual specific biometric features representing the identity of individuals such as commonly employed finger print and retina.Identification of speakers from their voice samples has recently found place particularly in security, telephone banking applications, voice dialing and legal cases. In legal cases, more important is to know voice belong to speaker or created in digital manipulation.In this thesis, pitch frequencies, duration and change gender of 850 male and 1188 female speakers voice samples which are in NIST2001 database have been chanced at particular percentages with software known as Praat. Then feature of original and manipulated voices were calculated by the method of MFCC (Mel Frequency Cepstral Coefficients) and classified by the method of VQ (Vector Quantization) and SVM (Support Vector Machines). The success of system has been tested to detect the manipulated sounds which are in database by comparing.
MFKK, Manipülasyon, Perde frekansı, Konuşma süresi, Cinsiyet değiştirme, Vektör nicemleme, Destek vektör makineleri, Praat, MFCC, Manipulation, Pitch frequency, Duration, Change gender, Vector quantization, Support vector machines
Çöpoğlu, S. (2013). Ses kayıtlarında manipülasyon varlığının tespit edilmesi. Yayınlanmamış yüksek lisans tezi. Uludağ Üniversitesi Fen Bilimleri Enstitüsü.