Simetrik çok değişkenli dağılımlarda aykırı değer belirleme yöntemlerinin performanslarının incelenmesi

dc.contributor.advisorErcan, İlker
dc.contributor.authorUzabacı, Ender
dc.contributor.departmentUludağ Üniversitesi/Sağlık Bilimleri Enstitüsü/Biyoistatistik Anabilim Dalı.tr_TR
dc.date.accessioned2019-12-02T13:40:09Z
dc.date.available2019-12-02T13:40:09Z
dc.date.issued2017-09-22
dc.description.abstractAykırı değer belirleme yöntemleri, tüm bilimsel çalışmalarda elde edilecek sonuçların güvenilir olması açısından önemli bir temel oluşturmaktadır. Çok değişkenli veri setlerinde aykırı değer belirleme yöntemlerinin kullanımı tek değişkenli duruma göre daha zor ve karışıktır. Bu tez çalışmasının amacı, çok değişkenli veri setlerinde aykırı değer belirleme yöntemlerinden BACON (Blocked Adaptive Computationally Efficient Outlier Nominators) algoritması, Hızlı Minimum Kovaryans Determinantı yöntemi (Fast-MCD) ve Robust Mahalanobis uzaklığı yöntemini incelemektir. Bu amaçla; çok değişkenli normal, çok değişkenli Cauchy ve çok değişkenli Laplace dağılımlarından farklı örneklem büyüklüğü ve değişken sayısına göre veriler türetilerek, aykırı değer belirleme yöntemlerinin performansları karşılaştırılmıştır. Performans değerlendirmesi için ölçüt olarak yanlış negatif ve yanlış pozitif değerler kullanılmıştır. Bu çalışmanın sonucunda, yöntemlerin performansının dağılım tipine göre farklılık gösterdiği tespit edilmiştir. Yanlış negatif ölçütü açısından BACON yönteminin, yanlış pozitif ölçütü açısından Robust Mahalanobis uzaklığı yönteminin diğer yöntemlerden daha iyi performans gösterdiği belirlenmiştir.tr_TR
dc.description.abstractOutlier detection methods constitute an important basis in terms of obtaining reliable results in all scientific studies. Determining outliers in multivariate data sets is more difficult and complicated than in univariate case. The aim of this thesis is to evaluate BACON (Blocked Adaptive Computationally Efficient Outlier Nominators) algorithm, Fast Minimum Covariance Determinant method (Fast-MCD) and Robust Mahalanobis distance method in multivariate data sets. For this purpose, outlier detection methods were compared by deriving data from multivariate normal, multivariate Laplace and multivariate Cauchy distributions with different sample size and number of variable. False negative and false positive values were used to evaluate performances. As a result of this work, it is determined that performance of methods varies according to distribution type. In terms of false negatives, BACON method and in terms of false positives, Robust Mahalanobis distance method were determined to perform better than the other methods.en_US
dc.format.extentVIII, 108 sayfatr_TR
dc.identifier.citationUzabacı, E. (2017). Simetrik çok değişkenli dağılımlarda aykırı değer belirleme yöntemlerinin performanslarının incelenmesi. Yayınlanmamış doktora tezi. Uludağ Üniversitesi Sağlık Bilimleri Enstitüsü.tr_TR
dc.identifier.urihttp://hdl.handle.net/11452/2140
dc.language.isotrtr_TR
dc.publisherUludağ Üniversitesitr_TR
dc.relation.publicationcategoryTeztr_TR
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectAykırı değertr_TR
dc.subjectÇok Değişkenli Veritr_TR
dc.subjectSağlam İstatistiklertr_TR
dc.subjectMahalanobis Uzaklığıtr_TR
dc.subjectOutlieren_US
dc.subjectMultivariate dataen_US
dc.subjectRobust statisticsen_US
dc.subjectMahalanobis distanceen_US
dc.titleSimetrik çok değişkenli dağılımlarda aykırı değer belirleme yöntemlerinin performanslarının incelenmesitr_TR
dc.title.alternativeEvaluation of outlier detection methods performance in symmetric multivariate distributionsen_US
dc.typedoctoralThesisen_US

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
487372.pdf
Size:
2.57 MB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: