Tespit edilemeyen verilerin analizinde kullanılan yöntemlerin karşılaştırılması

Thumbnail Image

Date

2017-02-13

Journal Title

Journal ISSN

Volume Title

Publisher

Uludağ Üniversitesi

Abstract

Çalışmalarda kullanılan alet, cihaz ya da araçlar bazı durumlarda belirli bir eşik değerin altındaki sonuçları ölçemez. Bu tür verilere tespit edilemeyen veriler denir. Yapılan çalışmalarda istatistiksel analizler için veri setlerinin eksiksiz olması büyük önem taşımaktadır. Bu nedenle tespit edilemeyen verilerin tahmininde kullanılan bazı yöntemlerden bazıları yerine değer atama, sıralı istatistiklerin regresyonu, çoklu değer atama, Tobit regresyon ve tespit edilemeyen veri regresyonudur. Bu yöntemlerin karşılaştırılmasında farklı tespit edilemeyen veri oranı ve örneklem büyüklüklerine göre simülasyon senaryoları oluşturulmuştur. Simülasyon sonucunda. farklı R2 değerlerine sahip her bir yöntem için örneklem büyükleri değiştikçe yöntemlerin hata kareler ortalaması köklerinin değişmediği görülmüştür. Karşılaştırdığımız yöntemler farklı R2 değerlerinde incelendiğinde; R2'nin 0,90 ve 0,70 olduğu durumlarda çoklu değer atama, alt sınır atanması ve Tobit regresyon yöntemlerinde hata kareler ortalaması köklerinin sırasıyla diğer yöntemlere göre daha düşük olduğu görülmüştür. Düşük açıklayıcılık katsayısı ve tespit edilemeyen veri oranı için testpi edilemeyen veri regresyonu alternatif bir yöntemdir.
Some machine, devices or tools used in some studies can not measure values below a certain threshold. Such observations are called non-detects data. It is of paramount importance that the data sets are complete for statistical analysis in the studies carried out. For this reason, some methods used for predicting non-detected data are; substitution of values, regression of on order statistics (ROS), multiple imputation, Tobit regression and non-detects data regression. For comparison of these methods, simulation scenarios were established according to the different percentage of non-detects data, sample sizes and coefficient of determination. According to simulation results, the root mean square error of methods did not change as the sample sizes changed for different levels of coefficient of determination. The methods Tobit regression, multiple imputation and substituted with detection limit have lower root mean square error than others while coefficient of determination were 0,90 and 0,70. For coefficient of determination and nondetects data proportion, nondetect data regreesion is an alternative method.

Description

Keywords

Tespit edilemeyen veri, Sıralı istatistiklerin regresyonu, Tobit regresyon, Tespit edilemeyen veri regresyonu, Non-detects data, Regression on order statistics, Tobit regression, Non-detects data regression

Citation

Çalışkan, G. (2017). Tespit edilemeyen verilerin analizinde kullanılan yöntemlerin karşılaştırılması. Yayınlanmamış yüksek lisans tezi. Uludağ Üniversitesi Sağlık Bilimleri Enstitüsü.