T.C. BURSA ULUDAĞ ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ İŞLETME ANABİLİM DALI SAYISAL YÖNTEMLER BİLİM DALI SAĞLIK SEKTÖRÜNDE MÜŞTERİ KAYIP ANALİZİ VE VERİ MADENCİLİĞİ İLE BİR UYGULAMA (DOKTORA TEZİ) MELİH KARAHASANOĞLU BURSA – 2023 i ÖZET Yazar Adı Soyadı : Melih Karahasanoğlu Üniversite : Bursa Uludağ Üniversitesi Anabilim Dalı : İşletme Bilim Dalı : İşletme Tezin Niteliği : Doktora Mezuniyet Tarihi : ....../......./2023 Tez Danışmanı : Doç. Dr. Gül Gökay Emel Sağlık Sektöründe Müşteri Kayıp Analizi ve Veri Madenciliği ile Bir Uygulama İşletmeler süreklilikleri için yeni müşteriler edinirken, müşteri portföylerini de tutundurmaya çalışmaktadırlar. Ağızdan ağıza pazarlamanın, sosyal medyanın mutsuz-kayıp müşterilere kazandırdığı etki alanı, yeni bir müşteri edinmenin mevcut müşterileri elde tutmaktan 5 ila 10 kat daha maliyetli oluşu, Müşteri Kayıp Analizinin (MKA) önemini arttırmıştır. MKA çalışmaları, müşteri aboneliği, sürekliliği bulunan sektörler için sıkça yer alırken sağlık sektöründe uygulamaları pek görülmemektedir. MKA’nın sağlık sektöründe yapılabilmesi için öncelikle, hizmet alıcılarının hangi durumlarda devamlı ve kayıp kabul edildiğini belirleyecek ölçütler gereklidir. Çocuk hastalar üzerine yapılan bu çalışmada, yıllık yaklaşık 5.000.000 hasta başvurusu olan bir özel sağlık kurumunun 2011-2018 yılları arasındaki 496.847 çocuk hastaya ait 3.400.000 başvurusu incelenmiştir. Öncelikle, ilgili yazın ve sağlık kuruluşunun büyük veri tabanı incelenmiş, kuruluşun uzmanları ile yarı yapılandırılmış mülakat yöntemi ile görüşmeler yapılmış, seçilen çocuk hastalar grubu için devamlı ve kayıp hasta kabul edilme ölçütleri yapılan nitel çalışma sonucunda belirlenmiştir. Veri madenciliği uygulama kısmında; çocuk hastaların yaşları, sosyal güvenceleri ve başvuru sıklıkları ile kayıp hasta kabul edilme durumu, ilgili hastaların sisteme kayıtlı şikâyetleri ile kayıp hasta kabul edilme durumları arasındaki örüntüler Karar Ağacı algoritmalarından CHAID ve CART ile analiz edilmiş ve tahminleme modelleri kurulmuştur. Anket sorularında Net Tavsiye Skorunu (NPS) etkileyen soruya verilen puanlandırma ile kayıp hasta kabul edilme durumu arasındaki örüntüler Ki-Kare testi ile incelenmiştir. Yaş, sosyal grup ve başvuru sıklıklarına göre kayıp hasta tahminlemesinde kullanılan Veri Madenciliği teknikleri sonuçları karşılaştırılmış ve yaş gruplarına göre 0-1, 1-2 yaş grubunda CHAID algoritmasının, 2-6 ve 6-10 yaş gruplarında CART algoritmasının, şikâyetler ve kayıp hasta tahminlemesinde ise CHAID algoritmasının daha başarılı sonuçlar verdiği gözlenmiştir. Ayrıca, en yüksek Kayıp hasta (churn) oranına sahip 2-6 yaş çocuk hasta grubunu en iyi açıklayan/bölünmeyi veren değerin çocuk hastaların 5-6 yaş aralığındaki başvuruları arasındaki maksimum gün farkı olduğu ve ilgili farkın 177 günden fazla olması durumunda kayıp hasta oranının çok daha belirgin olduğu saptanmıştır. Anahtar kelimeler: Müşteri Kayıp Analizi, Müşteri İlişkileri Yönetimi, Veri Madenciliği, Karar Ağaçları, Sağlık Hizmetleri Sunumu ii ABSTRACT Name & Surname : Melih Karahasanoğlu University : Bursa Uludağ University Institute : Institute of Social Sciences Field : Business Administration Subfield : Quantitative Tecniques Degree Awarded : PhD. Date of Degree Awarded : ......./....../ 2023 Supervisor : Assoc. Prof. Dr. Gül Emel Churn Prediction in Healthcare and an Application with Data Mining While businesses aim to acquire new customers, they also focus maintaining existing customers. With increased impact of word-of-mouth and social media on unhappy-churned customers and as acquiring new customers costs 5-10 times more than retaining existing ones, increased the importance of churn analysis. While churn prediction is frequently used in sectors with customer subscription basis, examples in healthcare are very limited. To apply churn analysis in healthcare, firstly criteria for profiling regular and churned patients need to be defined. 3,400,000 visits of 496,847 pediatric patients between 2011-2018 in a private hospital chain, which has approximately 5,000,000 patient-visits annually, were examined. Firstly, literature and database of the hospital were reviewed, subsequently, via qualitative techniques / semi-structured interviews were conducted with the experts to define criteria for regular and churned patients. In the data-mining; patterns between age, social security and admission frequency of the pediatric patients and churned-patient status, the complaints of the same patients registered in the system and the churned- patient status were analyzed with decision tree algorithms CHAID, CART and predictive models were established. The patterns between the question affecting Net Promoter Score in surveys and churned-patient status were examined via Chi-Squre Test. The results of the techniques were compared and it was observed that CHAID in the 0-1, 1-2 age groups, CART in 2-6 and 6-10 age groups for social security, age groups, frequency of visits vs. churn and CHAID for complaints vs. churn showed better results in predicting churned patients. Also, 2-6 years old group which has highest churn rate is explained best by maximum day difference between admission on the 5-6 years old, it was seen that when the maximum difference between 2 visits are more than 177 days, churn rate has a significant increase. Keywords: Customer Churn, CRM, Data Mining, Decision Trees, Provison of Healthcare Services iii ÖNSÖZ Araştırmanın fikir aşamasından tamamlanmasına kadar geçen tüm süreç boyunca desteğini her an yanımda hissettiğim, sabrı, ısrarcılığı ve yönlendirmeleri ile beni güçlendiren değerli danışman hocam Doç. Dr. Gül GÖKAY EMEL’e, araştırma fikrinin olgunlaşması, pratikleştirilmesi, uygulanmasında kendi yoğunluğu içerisinde ailesinden ve işinden ayırdığı uzun zamanlar için Prof. Dr. Sezgin IRMAK’a, zorlandığım anlarda yanımda olan ve motive eden yönlendirmeleri için Prof. Dr. Çağatan TAŞKIN’a gönülden teşekkür ederim. Çalışmayı yapabilmem için gerekli veri ve zamanı bana sağlayan, her yeni fikrimde yanımda olan kurumuma, bilgisini ve desteğini hiç esirgemeyen iş arkadaşlarım Sn. Sami SEVGİLİ, Sn. Mehmet ŞEKER ve Sn. Mehmet Orkun SARIBIYIK’a teşekkürü bir borç bilirim. Akademik hayatım boyunca her zaman manevi desteğini derinden hissettiğim kadim dostum Doç. Dr. Yusuf ACAR’a, yoğun iş hayatı ve uzun süren bu süreçte inancını hiç yitirmeyen, desteği ile hep yanımda olan aileme, sevgili can yoldaşım Ecem’e ve oğlum Ömer Ziya’ya şükranlarımı sunarım. MELİH KARAHASANOĞLU 03.03.2023 iv İÇİNDEKİLER ÖZET ................................................................................................................... i ABSTRACT ........................................................................................................ ii İÇİNDEKİLER .................................................................................................... iv TABLOLAR LİSTESİ ....................................................................................... viii ŞEKİLLER LİSTESİ ........................................................................................... ix KISALTMALAR ................................................................................................. xi GİRİŞ .................................................................................................................. 1 1. BÖLÜM MÜŞTERİ KAYIP ANALİZİ ................................................................................ 5 1.1. Müşteri ve Müşteri İlişkileri Yönetiminin Kavramsal Çerçevesi ................. 5 1.1.1. Müşteri Kavramı .............................................................................. 5 1.1.2. Müşteri Tatmini, Sadakati ve Davranışları ....................................... 5 1.1.3. Müşteri Yaşam Boyu Değeri ............................................................ 7 1.1.4. Müşteri İlişkileri Yönetimi ................................................................. 7 1.1.5. Müşteri Memnuniyeti Ölçümü ve Teknikleri ................................... 10 1.1.6. Pazarlama Karması ....................................................................... 13 1.2. Müşteri Kaybı (Churn) Analizi ................................................................. 14 1.2.1. Müşteri Kayıp Çeşitleri ..................................................................... 16 1.2.2. Müşteri Kayıp Tahmini ..................................................................... 18 2. BÖLÜM VERİ MADENCİLİĞİ KAVRAM VE YÖNTEMLERİ .......................................... 20 2.1. Veri, Enformasyon, Bilgi ve Bilgelik Kavramları ...................................... 20 2.2. Veri Tabanları ......................................................................................... 22 2.3. Veri Ambarları ........................................................................................ 23 2.4. Veri Madenciliği ...................................................................................... 23 2.4.1. VM Tarihsel Gelişimi ........................................................................ 24 2.4.2. Veri Madenciliği Uygulama Alanları ................................................. 25 2.4.3. Veri Tabalarında Bilgi Keşfi ve Veri Madenciliği Süreci.................... 26 2.4.3.1. CRISP-DM ................................................................................ 27 2.4.3.2. SEMMA ..................................................................................... 29 2.4.4. Veri Madenciliğinde Karşılaşılabilen Problemler .............................. 31 v 2.5. Veri Madenciliği Yöntemleri .................................................................... 31 2.5.1. Sınıflandırma ve Regresyon Modelleri ............................................. 33 2.5.1.1. Karar Ağaçları ........................................................................... 34 2.5.1.1.1. Karar Ağaçları Avantaj ve Dezavantajları ........................... 36 2.5.1.1.2. Bölme Kriterleri ................................................................... 37 2.5.1.1.2.1. DKM Kriteri ................................................................... 38 2.5.1.1.2.2. Bilgi Kazancı ................................................................ 38 2.5.1.1.2.3. Kazanç Oranı ............................................................... 40 2.5.1.1.2.4. Gini İndeksi .................................................................. 41 2.5.1.1.2.5. Twoning ........................................................................ 42 2.5.1.1.2.6. Ki-Kare Testi ................................................................ 43 2.5.1.1.3. Karar Ağacı Algoritmaları .................................................... 44 2.5.1.1.3.1. CHAID Algoritması ....................................................... 45 2.5.1.1.3.2. CART Algoritması ........................................................ 47 2.5.1.1.3.1. C5.0 Algoritması ........................................................... 48 2.5.1.2. Yapay Sinir Ağları ...................................................................... 49 2.5.1.3. Lojistik Regresyon ..................................................................... 51 2.5.1.4. Rassal Orman ........................................................................... 53 2.5.1.5. Destek Vektör Makinaları .......................................................... 54 2.5.1.6. Naive-Bayes Yöntemi ................................................................ 55 2.5.1.7. K- En Yakın Komşu ................................................................... 55 2.5.1.8. Genetik Algoritmalar .................................................................. 56 2.5.2. Kümeleme Modelleri ........................................................................ 57 2.5.3. Birliktelik Kuralları ve Modelleri ........................................................ 59 2.5.3.1. AIS Algoritması.......................................................................... 60 2.5.3.2. Apriori Algoritması ..................................................................... 60 2.5.3.3. CARMA Algoritması .................................................................. 61 3. BÖLÜM MÜŞTERİ KAYIP ANALİZİ VE VERİ MADENCİLİĞİ ....................................... 62 3.1. Veri madenciliği ve Müşteri Kayıp Analizi ............................................... 62 3.2. Sağlık Sektöründe Veri Madenciliği ........................................................ 66 3.3. Sağlık Sektöründe Müşteri Kayıp Analizi ................................................ 70 3.3.1. Türkiye’deki Sağlık Sektörünün ve Hasta Tercihlerinin Gelişimi ...... 70 3.3.2. Sağlık Kurumlarında Müşteri Kayıp Analizi’nin Önemi ..................... 71 vi 3.3.3. Sağlık Kurumlarında Müşteri ve Hasta Kavramsal Çerçeve ............ 72 3.3.4. Sağlık Kurumlarında Müşteri Kayıp Analizinin Kullanım Alanları ve Örnekleri .................................................................................................... 74 4. BÖLÜM SAĞLIK SEKTÖRÜNDE MKA İÇİN BİR ARAŞTIRMA VE METODOLOJİSİ .. 77 4.1. Araştırmanın Önemi ............................................................................... 77 4.2. Araştırmanın Amacı ve Soruları ............................................................. 78 4.3. Araştırmanın Yöntemi ve Aşamaları ....................................................... 79 4.3.1. Geliş Sıklıkları ve Kayıp Hasta Tahminlemesi ................................. 80 4.3.2. Şikâyetler ve Kayıp Hasta Tahminlemesi ......................................... 85 4.3.3. Anketler ve Kayıp Hasta Tahminlemesi ........................................... 86 4.4. Araştırmanın Model Değerlendirme Kriterleri ......................................... 87 4.5. Araştırmanın Kısıtları .............................................................................. 89 5. BÖLÜM ARAŞTIRMANIN BULGULARI VE DEĞERLENDİRME METRİKLERİ ........... 91 5.1. Devamlı Hasta/ Kayıp Hasta Belirleme Ölçütleri .................................... 91 5.1.1. Devamlı Hasta Kabul Edilme Ölçütleri ve Nedenleri ........................ 92 5.1.2. Çocuk Hasta Gruplamaları ve Geliş Sıklıkları .................................. 93 5.1.3. Kayıp Hasta Belirleme Ölçütleri ve Nedenleri .................................. 94 5.2. Geliş Sıklıkları ve MKA ........................................................................... 94 5.2.1. 0-1 Yaş Grubu Geliş Sıklıkları ve MKA ............................................ 96 5.2.1.1. CHAID Algoritması ile Bulgular ve Değerlendirme Metrikleri ..... 96 5.2.1.2. CART Algoritması ile Bulgular ve Değerlendirme Metrikleri .... 103 5.2.1. 1-2 Yaş Grubu Geliş Sıklıkları ve MKA .......................................... 110 5.2.1.1. CHAID Algoritması ile Bulgular ve Değerlendirme Metrikleri ... 110 5.2.2.2. CART Algoritması ile Bulgular ve Değerlendirme Metrikleri .... 118 5.2.3. 2-6 Yaş Grubu Geliş Sıklıkları ve MKA .......................................... 123 5.2.3.1. CHAID Algoritması ile Bulgular ve Değerlendirme Metrikleri ... 124 5.2.3.2. CART Algoritması ile Bulgular ve Değerlendirme Metrikleri .... 142 5.2.4. 6-10 Yaş Grubu Geliş Sıklıkları ve MKA ........................................ 149 5.2.4.1. CHAID Algoritması ile Bulgular ve Değerlendirme Metrikleri ... 149 5.2.4.2. CART Algoritması ile Bulgular ve Değerlendirme Metrikleri .... 161 5.3. Şikâyetler ve MKA ................................................................................ 167 vii 5.3.1. CHAID Algoritması ile Bulgular ve Değerlendirme Metrikleri ......... 168 5.3.2. CART Algoritması ile Bulgular ve Değerlendirme Metrikleri ........... 173 5.4. Hasta Memnuniyet Anketleri ve MKA ................................................... 177 SONUÇ VE ÖNERİLER .................................................................................. 181 KAYNAKÇA ................................................................................................... 191 EKLER ............................................................................................................ 208 ÖZGEÇMİŞ ............................................................. Error! Bookmark not defined. viii TABLOLAR LİSTESİ Tablo 2.1.: Veri Madenciliği Modelleri ve Kullanım Alanları ........................................ 33 Tablo 2.2.: Karar Ağacı Algoritmaları ve Özellikleri .................................................... 45 Tablo 2.3.: Kümeleme Metotları ve Genel Özellikleri .................................................. 58 Tablo 4.1.: Geliş Sıklıkları ve Churn Modeli Temin Edilen Değişkenler ve Tanımlamaları ............................................................................................................. 81 Tablo 4.2.: Geliş Sıklıkları ve Churn Eklenen Değişkenler ve Tanımlamaları ............. 82 Tablo 4.3.: Yaş Grupları ve Geliş Sıklıkları Grupları ................................................... 83 Tablo 4.4.: Devamlı Hasta ve Kayıp Hasta Kabul Kriterleri ......................................... 83 Tablo 4.5.: Karşıtlık Matrisi Tanıtımı ........................................................................... 87 Tablo 5.1.: Model Yaş Grup Değişkeni Churn Etiketi .................................................. 95 Tablo 5.2.: 1-12 Ay CHAID Poliklinik Adetleri ve Churn Durumu ................................ 97 Tablo 5.3.: 0-1 Yaş CHAID Değerlendirme Metrikleri ............................................... 101 Tablo 5.4.: 0-1 Yaş CHAID Karşıtlık Matrisi .............................................................. 102 Tablo 5.5.: 0-1 Yaş CART Değerlendirme Metrikleri ................................................. 108 Tablo 5.6.: 0-1 Yaş CHAID Karşıtlık Matrisi .............................................................. 109 Tablo 5.7.: 1-2 Yaş Poliklinik Başvurularına Göre Churn Durumu ............................ 111 Tablo 5.8.: 1-2 Yaş CHAID Değerlendirme Metrikleri ............................................... 116 Tablo 5.9.: 1-2 Yaş CHAID Karşıtlık Matrisi .............................................................. 117 Tablo 5.10.: 1-2 Yaş CART Değerlendirme Metrikleri ............................................... 122 Tablo 5.11.: 1-2 Yaş CART Karşıtlık Matrisi ............................................................. 122 Tablo 5.12: 2-6 Yaş CHAID MAXG_5 Sınıfı Başvurular Arası Gün Farkı ve Kayıp hasta Durumu ..................................................................................................................... 124 Tablo 5.13: 2-6 Yaş CHAID MAXG_4 Sınıfı Başvurular Arası Gün Farkı ve Kayıp hasta Durumu ..................................................................................................................... 131 Tablo 5.14: 2-6 Yaş CHAID Son ve Sondan2. Başvurular Arası Gün Sayısı ve Kayıp hasta Durumu ........................................................................................................... 134 Tablo 5.15: 2-6 Yaş CHAID Değerlendirme Metrikleri .............................................. 140 Tablo 5.16: 2-6 Yaş CHAID Karşıtlık Matrisi ............................................................. 140 Tablo 5.17.: 2-6 Yaş CART Değerlendirme Metrikleri ............................................... 147 Tablo 5.18: 2-6 Yaş CART Karşıtlık Matrisi .............................................................. 148 Tablo 5.19: 6-10 Yaş CHAID MAXG_6 Sınıfı Başvurular Arası Gün Farkı ve Kayıp hasta Durumu ........................................................................................................... 150 Tablo 5.20: 6-10 Yaş CHAID Değerlendirme Metrikleri ............................................ 159 Tablo 5.21: 6-10 Yaş CHAID Karşıtlık Matrisi ........................................................... 160 Tablo 5.22: 6-10 Yaş CART Değerlendirme Metrikleri .............................................. 165 Tablo 5.23: 6-10 Yaş CART Karşıtlık Matrisi ............................................................ 165 Tablo 5.24: Şikayetler CHAID Değerlendirme Metrikleri ........................................... 171 Tablo 5.25: Şikâyetler CHAID Karşıtlık Matrisi ......................................................... 171 Tablo 5.26: Şikayetler CART Değerlendirme Metrikleri ............................................ 176 Tablo 5.27: Anketler ve Kayıp hasta Ki-Kare Testi Sonuçları ................................... 178 ix ŞEKİLLER LİSTESİ Şekil 2.1.: Veri, Enformasyon, Bilgi ve Bilgeliğin Bağlantılılığı .................................... 21 Şekil 2.2: Veri Madenciliği Bilgi Keşfi Süreci ............................................................... 26 Şekil 2.3. : CRISP-DM Modeli .................................................................................... 27 Şekil 2.4.: SEMMA Modeli .......................................................................................... 30 Şekil 2.5.: Örnek Karar Ağacı Modeli ......................................................................... 34 Şekil 2.6.: Yapay Sinir Ağı Katmanları ........................................................................ 50 Şekil 2.7.: Lojistik Regresyon Eğrisi ........................................................................... 52 Şekil 2.8.: Destek Vektör Makinaları Grafiksel İşleyişi ................................................ 55 Şekil 2.9.: Genetik Algoritmaların İşleyişi ................................................................... 56 Şekil 2.10.: Koordinat Düzleminde Kümeleme Örneği ................................................ 57 Şekil 2.11.: Birliktelik Kuralları İşlem Adımları ............................................................ 59 Şekil 4.1.: Veri Madenciliği ile Bilgi Keşfi Adımları ..................................................... 80 Şekil 5.1.: Geliş Sıklıkları ve Yaş Gruplarına Göre Churn Genel Bakış ...................... 95 Şekil 5.2.: 0-1 Yaş CHAID Genel Durumu .................................................................. 96 Şekil 5.3.: 0-1 Yaş CHAID 2. Düğüm Dalları .............................................................. 98 Şekil 5.4.: 0-1 Yaş CHAID 3. Düğüm Dalları .............................................................. 98 Şekil 5.5.: 0-1 Yaş CHAID 6. Düğüm Dalları .............................................................. 99 Şekil 5.6.: 0-1 Yaş CHAID 7. Düğüm Dalları ............................................................ 100 Şekil 5.7.: 0-1 Yaş CART Genel Durumu ................................................................. 103 Şekil 5.8.: 0-1 Yaş CART İlk Bölünme ...................................................................... 104 Şekil 5.9.: 0-1 Yaş CART 1. Düğüm ve Alt Dalları .................................................... 104 Şekil 5.10.: 0-1 Yaş CART 4. Düğüm ve Dalları ....................................................... 105 Şekil 5.11.: 0-1 Yaş CART 2. Düğüm ve Dalları ....................................................... 106 Şekil 5.12.: 0-1 Yaş CART 5. Düğüm ve Dalları ....................................................... 106 Şekil 5.13.: 0-1 Yaş CART 12. Düğüm ve Dalları ..................................................... 107 Şekil 5.14.: 0-1 Yaş CART 6. Düğüm ve Dalları ....................................................... 108 Şekil 5.15.: 1-2 Yaş CHAID Genel Durum ................................................................ 110 Şekil 5.16.: 1-2 Yaş CHAID 1. Düğüm ve Dalları ...................................................... 112 Şekil 5.17.: 1-2 Yaş CHAID 12. Düğüm ve Dalları .................................................... 112 Şekil 5.18.: 1-2 Yaş CHAID 13. Düğüm ve Dalları .................................................... 113 Şekil 5.19.: 1-2 Yaş CHAID 14. Düğüm ve Dalları .................................................... 113 Şekil 5.20: 12 Yaş CHAID 8. Düğüm ve Dalları ........................................................ 114 Şekil 5.21.: 1-2 Yaş CHAID 9. Düğüm ve Dalları ...................................................... 115 Şekil 5.22.: 1-2 Yaş CHAID 10. Düğüm ve Dalları .................................................... 116 Şekil 5.23.: 1-2 Yaş CART Genel Durumu ............................................................... 118 Şekil 5.24.: 1-2 Yaş CART 1. Düğüm ve Dalları ....................................................... 119 Şekil 5.25.: 1-2 Yaş CART 3. Düğüm ve Dalları ....................................................... 119 Şekil 5.26.: 1-2 Yaş CART 15. Düğüm ve Dalları ..................................................... 120 Şekil 5.27.: 1-2 Yaş CART 17. Düğüm ve Dalları ..................................................... 121 Şekil 5.28.: 2-6 Yaş CHAID Genel Durumu .............................................................. 124 Şekil 5.29.: 2-6 Yaş CHAID 1. Düğüm ve Dalları ...................................................... 125 Şekil 5.30.: 2-6 Yaş CHAID 2. Düğüm ve Dalları ...................................................... 126 Şekil 5.31.: 2-6 Yaş CHAID 3. Düğüm ve Dalları ...................................................... 127 Şekil 5.32: 2-6 Yaş CHAID 4. Düğüm ve Dalları ....................................................... 128 Şekil 5.33: 2-6 Yaş CHAID 5. Düğüm ve Dalları ....................................................... 129 Şekil 5.34.: 2-6 Yaş CHAID 6. Düğüm ve Dalları ...................................................... 129 Şekil 5.35: 2-6 Yaş CHAID 7. Düğüm ve Dalları ....................................................... 130 Şekil 5.36.: 2-6 Yaş CHAID 8. Düğüm ve Dalları ...................................................... 130 Şekil 5.37.: 2-6 Yaş CHAID 27. Düğüm ve Dalları .................................................... 131 x Şekil 5.38.: 2-6 Yaş CHAID 28. Düğüm ve Dalları .................................................... 132 Şekil 5.39.: 2-6 Yaş CHAID 27. Düğüm ve Dalları .................................................... 132 Şekil 5.40.: 2-6 Yaş CHAID 30. Düğüm .................................................................... 133 Şekil 5.41.: 2-6 Yaş CHAID 32. ve 33. Düğüm ......................................................... 134 Şekil 5.42.: 2-6 Yaş CHAID 40. Düğüm ve Dalları .................................................... 135 Şekil 5.43.: 2-6 Yaş CHAID 41. Düğüm ve Dalları .................................................... 136 Şekil 5.44.: 2-6 Yaş CHAID 42. Düğüm ve Dalları .................................................... 137 Şekil 5.45.: 2-6 Yaş CHAID 43. Düğüm ve Dalları .................................................... 138 Şekil 5.46.: 2-6 Yaş CHAID 44-45-46. Düğüm ve Dalları .......................................... 139 Şekil 5.47.: 2-6 Yaş CART Genel Durumu ............................................................... 142 Şekil 5.48.: 2-6 Yaş CART 3 - 4. Düğüm ve Dalları .................................................. 143 Şekil 5.49.: 2-6 Yaş CART 2. Düğüm ve Dalları ....................................................... 144 Şekil 5.50.: 2-6 Yaş CART 5. Düğüm ve Dalları ....................................................... 145 Şekil 5.51.: 2-6 Yaş CART 6. Düğüm ve Dalları ....................................................... 146 Şekil 5.52.: 6-10 Yaş CHAID Genel Durum .............................................................. 149 Şekil 5.53.: 6-10 Yaş CHAID 1. Düğüm ve Dalları .................................................... 151 Şekil 5.54.: 6-10 Yaş CHAID 2. Düğüm ve Dalları .................................................... 152 Şekil 5.55.: 6-10 Yaş CHAID 3. Düğüm ve Dalları .................................................... 153 Şekil 5.56.: 6-10 Yaş CHAID 17. Düğüm ve Dalları .................................................. 154 Şekil 5.57.: 6-10 Yaş CHAID 4. Düğüm ve Dalları .................................................... 155 Şekil 5.58.: 6-10 Yaş CHAID 20. Düğüm ve Dalları .................................................. 156 Şekil 5.59.: 6-10 Yaş CHAID 5. Düğüm ve Dalları .................................................... 157 Şekil 5.60.: 6-10 Yaş CHAID 23. Düğüm ve Dalları .................................................. 158 Şekil 5.61.: 6-10 Yaş CHAID 6. Düğüm .................................................................... 159 Şekil 5.62.: 6-10 Yaş CART Genel Durumu ............................................................. 161 Şekil 5.63.: 6-10 Yaş CART 1. Düğüm ve Dalları ..................................................... 162 Şekil 5.64.: 6-10 Yaş CART 2. Düğüm ve Dalları ..................................................... 164 Şekil 5.65.: Şikâyetler ve Kayıp hasta CHAID Uygulama Genel Durumu ................. 168 Şekil 5.66.: Şikâyetler CHAID 1. Düğüm ve Dalları .................................................. 169 Şekil 5.67.: Şikâyetler CHAID 2. Düğüm ve Dalları .................................................. 170 Şekil 5.68.: Şikayetler ve Kayıp hasta CART Uygulaması 1. Düğüm ve 2. Düğüm ve Dalları ....................................................................................................................... 173 Şekil 5.69.: Şikayetler CART 3. Düğüm ve Dalları .................................................... 174 Şekil 5.70.: Şikayetler CART 4. Düğüm ve Dalları .................................................... 175 Şekil 5.71.: Şikayetler CART 5. Düğüm ve Dalları .................................................... 176 Şekil 5.72.: Kültürel Boyut Ölçütünde Ülke Karşılaştırması ...................................... 180 xi KISALTMALAR AHP : Analitik Hiyerarşi Prosesi BV : Büyük Veri CART : Classification & Regression Trees (Sınıflandırma ve Regresyon Ağaçları) CES : Customer Effort Score (Müşteri Efor Puanı) CHAID : Chi-Squared Automatic Interaction Detector (Ki-Kare Otomatik Etkileşim Dedektörü) CRISP-DM : Cross Industry Standard Process Model for Data Mining (Endüstriler Arası Standart İşleme – Veri Madenciliği) CRM : Customer Relationship Management CSAT : Customer Satisfaction Score (Müşteri Memnuniyet Puanı) DVM : Destek Vektör Makinaları İVTYS : İlişkisel Veri Tabanı Yönetim Sistemi CLV : Customer Lifetime Value LR : Lojistik Regresyon MİY : Müşteri İlişkileri Yönetimi MKA : Müşteri Kayıp Analizi MYBD : Müşteri Yaşam Boyu Değeri NPS : Net Promoter Score (Net Tavsiye Puanı) OLAP : On-ine Analytical Processing (Çevrim İçi Analitik İşleme) OLTP : On-Line Transaction Processing (Çevrim İçi Hareket İşleme) RO : Rassal Orman SEMMA : Sample, Explore, Modify, Model and Assess (Örnekleme, Keşfetme, Değiştirme, Modelleme ve Değerlendirme) SQL : Structured Query Language (Yapısal Sorgu Dili) VA : Veri Ambarı VM : Veri Madenciliği VTBK : Veri Tabanlarında Bilgi Keşfi VTS : Veri Tabanı Sistemi VTYS : Veri Tabanı Yönetim Sistemi YSA : Yapay Sinir Ağları 1 GİRİŞ Günümüzdeki teknolojik gelişmeler ve kültürel değişimler, işletmelerin çalışma ortam ve biçimini etkilemiş, işletmelerin başarısı için ekosistemlerinin verimliliği çok önemli olmuş ve sorunlar ortak değer tabanlı geleceği inşa etmeye yönelik iş modelleri ile çözülür hale gelmiştir. Teknoloji ve müşteri yönetimi ile ilgili yeni birçok kavram iş yazınında yerini almış, işletmeler ise bu kavramlara dayalı iş modelleri için aksiyon aşamasına geçmişlerdir. İşletmeler için büyümenin ya da hayatta kalmanın en temel faktörlerinden birisi, hizmet sunumuna yeni müşterileri eklemek ya da mevcut müşterilerini koruyabilmektir. Yapılan araştırmalarda; yeni müşteri kazanmanın, mevcut müşteriyi mutlu edip elde tutmaya göre beş ile on kat daha maliyetli olduğu saptanmıştır (Kotler ve Amstrong, 2017). Beal (2014), yeni müşteri kazanmanın mevcut müşteriyi elde tutmaktan yedi kat daha maliyetli olduğunu ve memnuniyetsiz ayrılan müşterilerin %96’sının şikâyet başvurusunun olmadığını fakat deneyimlerini en az 15 kişi ile paylaştıklarını ortaya koymuştur. Genellikle, memnun ayrılan bir müşteri ise görüşlerini, önerilerini çevresindeki sadece iki-üç kişi ile paylaşmaktadır. Nilsen (2012), raporunda müşterilerinin %92’sinin ağızdan ağıza pazarlamayı diğer pazarlama-iletişim kanallarını kullanmaya tercih ettiklerini, tanıdıklarından duydukları ya da müşteri bloglarından okumuş oldukları müşteri deneyimlerini daha güvenilir bulduklarını paylaşmıştır. Özellikle, hizmet sektöründeki müşterilerin memnuniyetsizliklerini dile getirmedeki yatkınlığı da göz önünde bulundurulduğunda, ağızdan ağıza pazarlama kanalı olan mevcut müşteriler, bireysel bağlılıklarının yanı sıra işletmenin büyümesinde etkin bir rol almaktadırlar. Sernovitz (2012) ve Ruby’nin (2015) yaptığı çalışmalar, memnuniyetsiz–sorunu çözülmemiş bir müşterinin potansiyel etkisini kaldırmak için yaklaşık 12 tane yeni müşteri kazanılması ya da 12 tane olumlu yorum alınması gerektiğini göstermektedir. Ağızdan ağıza pazarlama kanalını oluşturan mevcut müşterilerin memnuniyet ve şikayetlerini dile getirme şekli, sosyal medyanın yaygınlığı, hızı ve rakipler arasında müşteri kayması üzerindeki gücü, mevcut müşterileri elde tutmayı çok daha önemli hale getirmiştir. Bu gerçeğin farkında olan birçok hizmet sektöründe çalışan işletme ise satış kanallarını arttırmayı hedeflemekle birlikte, mevcut 2 müşteriyi mutlu etmenin ya da elde tutmanın yollarına daha fazla odaklanmaya başlamıştır. Dolayısıyla, işletmeler için yeni müşteri kazanmanın maliyeti, mevcut müşteriyi memnun etmenin maliyeti ile kıyaslanan ve takip edilen kritik bir performans göstergesi konumuna gelmeye başlamıştır. İşletmeler, müşteri kayıplarını minimize etmek için kimlerin kayıp müşteri olabileceğini önceden tahmin edebilmelidirler. İlgili tahminlerin yapılabilmesi için ise öncellikle hem hizmet alımına devam eden müşterilerin hem de başka bir hizmet sunucusuna geçen kaybedilen müşterilerin profil yapıları, segmentleri, talepleri, davranış ve eğilimlerinin iyi anlaşılmış olması gerekmektedir. Pazarlama ve müşteri ilişkileri yönetimi birimleri koordineli çalışarak kayıpları önlenmeye çalışmalıdırlar. Yazında ve pratik uygulamalarda ise bu ihtiyacın Müşteri Kayıp Analizi (MKA) ile sağlanabileceği gözlenmiştir. Yazında, müşteri yıpranması (customer attrition), müşteri cayması (customer turnover), müşteri kaçması (customer defection) gibi terimlerle de ilişkili olsa da en kapsayıcı tanım kayıp müşteri (customer churn) olarak görülmüştür. MKA; genellikle telekomünikasyon, bankacılık ve sigortacılık gibi müşteri sürekliliği bulunan sektörlerde uygulanmaktadır. Bu tarz arzın yoğun olduğu sektörlerde müşteriler, ellerindeki alternatifler doğrultusunda kolaylıkla hizmet sunucusu değişikliğine gidebilmektedir. Yeni müşteri bulmanın maliyeti de göz önünde bulundurulduğunda, mevcut müşterilerin elde tutulması, yani hizmet alımının devam etmesi, şirketlerin sürdürülebilirliği açısından kritik bir rol almaktadır. Dolayısıyla, mevcut müşterilerin tercih ve eğilimleri yakinen izlenmelidir. Temelde işletmeler, veri madenciliği teknikleri ile ellerindeki dağınık veriyi anlamlı hale getirmeye ve geçmişteki müşteri eğilimleri ile karşılaştırarak, müşteriler için kritik hizmet sunucusu değiştirme noktalarını saptamaya çalışmaktadırlar. Bu çalışma sonucunda da müşterilerinin hizmet alım yaşam döngülerini belirlemeye çalışmaktadırlar. İşletmeler ile ilgili sınıflandırma ve tahmin modelleri yapıldığında, müşterilerinin olası kaybedilme durumu öncesi çeşitli tutundurma faaliyetleri üzerinden olası tahminlenen kaybı önlemeye çalışabilmektedirler. 3 Yapılan bu çalışmada ise amaç; bankacılık, telekomünikasyon ve sigortacılık gibi sektörlere göre nispeten kurumsal olarak daha az gelişmiş sağlık ve özellikle hastane sektöründe bir uygulama örneği üzerinden kayıp müşterileri tanımlayabilmek, tutum-eğilimlerini saptayacak, gelecekteki eğilimlerini tahmin edebilecek bir model kurgulamak ve müşteri kayıplarını önlemeye çalışacak aksiyon planlarına ışık tutmaktır. Dünya genelinde sağlık sektöründe MKA uygulanmasının çok nadir olması ve Türkiye’de ise bu uygulamanın yazın taramasında saptanmaması çalışmayı farklı kılan unsurlardandır. Ayrıca bu çalışma ile (kayıp müşterilerinin nedenleri ile tanımlanıp, yeni kayıpların önlenmesinin) birçok açıdan sağlık hizmeti sunucusuna ve hastalara (hizmet kalitesi ve toplum sağlığı gibi) olumlu katkılarının olacağı yeni çalışmalara ışık tutması amaçlanmaktadır. Ayrıca, çalışma kapsamında aşağıdaki bazı sorulara da yanıtlar aranacaktır: • Sağlık sektöründe hasta mı müşteri mi daha kabul edilir bir tanımlamadır? • Sağlık sektöründe sürekli hizmet alıcısı ve kayıp hizmet alıcısı tanımlanabilir mi? • MKA her hastaya uygulanabilir mi? • Sağlık sektöründe hastaların hizmet sunucularını değiştirmekteki eğilimleri, abonelik, müşteri sürekliliği bulunan diğer sektörlerde olduğu gibi MKA ile değerlendirilip önleyici faaliyetlerde bulunabilinir mi? • Hastaların geliş sıklıkları ve kayıp hasta kabul edilme durumları arasında bir ilişki var mıdır? • Hastaların ayrılma nedenleri hasta gruplarına göre değişiklik gösterir mi? • Hastaların şikayetleri ile kayıp hasta kabul edilme durumları arasında bir ilişki var mıdır? • Hastaların Net Tavsiye Puanını (NPS) etkileyen anket sorusuna verdiği cevaplar ile kayıp hasta kabul edilme durumu arasında ilişki kurulabilir mi? • Hastaların hizmet sunucusundan ayrılmaları tahminlenebilir mi? 4 Bu doğrultuda; çalışmanın ilk iki bölümünde yazın taraması ile Müşteri Kayıp Analizi’nin ve Veri Madenciliği’nin kavramsal çerçevesi uygulama örnekleri ile incelenmiştir. Üçüncü bölümde, sağlık sektörü ve Veri Madenciliği ele alınmıştır. Müşteri-hasta, devamlı-kayıp hizmet alıcısı gibi kavramlar ve alanda yapılan çalışmalar, yazın ve sektörel bilgi ışığında irdelenmiştir. Dördüncü bölümde, çalışmanın amaç, yöntem ve aşamaları paylaşılmıştır. Beşinci bölümde, yapılan çalışmanın analiz bulguları paylaşılmıştır. Özel bir sağlık grubunun 500 bine yakın hastasının 3 milyona yakın hizmet alım başvurusu üzerinden Veri Madenciliği tekniklerinden CHAID (Chi-Squared Automatic Interaction Detector) ve CART (Classification And Regression Trees) algoritmaları aracılığı ile MKA yapılmış, modeller karşılaştırılmış ve bulgular değerlendirilmiştir. Ayrıca, çocuk hastalara ait şikayetler ve kayıp hizmet alıcısı kabul edilme durumu yine CHAID ve CART ile karşılaştırılmalı olarak değerlendirilmiştir. Çalışmanın uygulama bölümünde son olarak, anketler ve kayıp hizmet alıcısı kabul edilme örüntüleri Ki- Kare testi aracılığı ile incelenmiştir. Son bölümde ise; çalışmanın çıktıları sağlık sektörünün yapısı, pazarlama bilimi ve kültürel pencereden değerlendirilmiş ve gelecekteki olası çalışmalara önermeler ile tamamlanmıştır. 5 1. BÖLÜM MÜŞTERİ KAYIP ANALİZİ 1.1. Müşteri ve Müşteri İlişkileri Yönetiminin Kavramsal Çerçevesi Bu bölümde müşteri ve müşteri ilişkileri yönetimine ait kavramsal çerçeve paylaşılmıştır. 1.1.1. Müşteri Kavramı Şirketlerin devamlılıkları için ürettikleri, sundukları mal ya da hizmetlere sürekli olarak alıcı bulmaları gerekmektedir. Buradaki alıcılar; müşteri olarak anılmakta, en basit tanımlama ile belirli bir mal veya hizmet sunucusunda düzenli alışverişte bulunan ya da yapma niyetinde olan kişiler olarak tanımlanmaktadır (Barış ve Odabaşı, 2002). Simmons (2014)’a göre müşteri, mal ve/veya hizmet sunucusuna satın aldıkları mal ve/veya hizmet ile gelir sağlayan kurum ya da insanlardır. Müşteri kavramı, alınan hizmet ya da malın aynı zamanda son kullanıcısı olunduğu durumlar dışında tüketici kavramı ile ayrışmaktadır. Kotler ve Keller (2009), tüketiciyi ihtiyaçlarını karşılamak amacı ile bir ürün veya hizmet için ücret ödeyen belirli kişi veya taraf olarak tanımlamıştır. Dolayısı ile her ne kadar müşteri ve tüketici, ihtiyaç ve isteklerini karşılamak için alışveriş yapan kişiler olarak tanımlansa da, bir süpermarketten alışveriş yapan restorant müşteri iken, restoranda alınan malzemelerle yapılan yemeği yiyenler yani nihai kullanıcılar ise tüketici olarak tanımlanmaktadır (Majava, vd., 2013). 1.1.2. Müşteri Tatmini, Sadakati ve Davranışları Kotler (2000) tarafından müşteri tatmini-memnuniyeti; bir kişinin bir ürünün algılanan performansı ile kendi beklentilerini karşılaştırmasından kaynaklanan zevk veya hayal kırıklığı duyguları olarak tanımlanmıştır. Hansemark ve Albinsson (2004)’a göre ise "memnuniyet; bir hizmet sağlayıcıya yönelik genel bir müşteri tutumu veya bazı ihtiyaçların, hedeflerin veya arzuların yerine 6 getirilmesi ile ilgili olarak müşterilerin, bekledikleri ile deneyimledikleri arasındaki farkla ilgili duygusal bir tepkidir". Bir başka tanımlama ile müşteri memnuniyeti; arzu edilen, beklenen mal ya da hizmetin alıcıya sunulması ve alıcı tarafından satın alınması sonrası beklentinin karşılanmasıdır (Pekmezci, vd., 2008). Müşterilerin tatmin olması, işletmeden mal ve hizmet alımına devam edilmesi anlamına gelmektedir. Yapılan çalışmalarda, mevcut müşteriyi elde tutma oranındaki %5’lik bir artışın birçok sektörde müşterilerin net mevcut değerlerinde %25 ile %85 arasında artışa olanak tanıdığı paylaşılmaktadır (Reichled ve Sasser, 1990; Reicheld, 1996). Bu doğrultuda, memnuniyetsiz müşterilerin birim olarak kaybının yanı sıra mahrum kalınan muhtemel ömür boyu katkıları ve deneyimlerini paylaşarak etkileyecekleri potansiyel müşteri kitlesi düşünüldüğünde, müşteri tatmini-memnuniyeti ölçülen ve yakın takip edilen bir konu haline gelmiştir. Sağlanan müşteri tatminini firmalara, İngilizce yazında “customer loyalty” olarak geçen müşteri sadakati konusunu gündeme getirmiştir. Dick ve Basu (1994), sadakati müşterinin markaya bağlılığı veya markaya yaklaşımı (hizmet, ürün kategorisi vb.) olarak tanımlamıştır. Sadakat, belirli bir marka ile ilişkiyi sürdürme beklentisi olarak da yorumlanmaktadır. Aeker'e (1991) göre marka sadakati, "müşterinin bir markaya duyduğu bağlılık" olarak tanımlanmaktadır. Müşteri sadakati oluşturabilmek için müşteri tatminini sağlamak, müşteri tatmini için de müşteri davranışlarının anlaşılması gerekmektedir. Müşteri davranışları, genel olarak bireylerin, grupların ve kuruluşların ihtiyaç ve isteklerini karşılamak için malları, hizmetleri, fikirleri veya deneyimleri nasıl seçtiği, satın aldığı, kullandığı ve elden çıkardığı olarak tanımlanabilmektedir (Kotler ve Keller, 2009). Dolayısıyla, müşterilerin davranışları iyi anlaşılmalı, olası müşteri kaybı önceden tespit edilmeli, engellenmeli, memnuniyetleri sağlanmalı ve sadakat düzeyleri üzerine çalışılmalıdır. 7 1.1.3. Müşteri Yaşam Boyu Değeri İngilizce yazında Customer Lifetime Value (CLV) olarak yerini bulan Müşteri Yaşam Boyu Değeri (MYBD), bir işletmenin müşterisi ile bağından ileride kazanacağı değerin, bugünkü zamanda maddi karşılığı olarak tanımlanabilmektedir (Yörük ve Eşmekaya, 2018). Bir başka tanım da; bir şirketin kazançlarının ve dolayısı ile değerinin, müşterilerin şirkete sağladığı gelecekteki kârların iskonto edilmiş değeri olarak tanımlanmış toplam MYBD olarak yer bulmuştur (Gupta ve Lehmannand, 2004). MYBD’nin amacı; şirket için müşterilerinin her birinin finansal değerini belirlemektir. MYBD geçmişteki verilerden yararlanarak çıkarım yapmakta ve gelecekte müşterinin firmaya sağlayacağı değeri tahmin etmektedir (Jain, Dipak ve Siddhartha, 2002). Bu açıdan, geçmişteki verilerin ölçülmesi ve değerlendirilmesi ile saptanan müşteri karlılığı birbirinden ayrılmaktadır. Yapılan çalışmalarla ulaşılmak istenen, müşterinin gelecekteki oluşturması beklenen toplam gelirleri ve ilgili müşterinin tutundurulması için toplam maliyet arasındaki farkın bugünkü değeridir. MYBD = Toplam Müşteri Gelirleri – Toplam Müşteri Maliyetleri şeklinde formüle etmek mümkündür. 1.1.4. Müşteri İlişkileri Yönetimi Müşteri İlişkileri Yönetimi (MİY), yabancı yazında Customer Relationship Management (CRM) olarak geçen, etkili müşteri ilişkileri ve etkileşimleri geliştirerek ve sürdürerek müşteri memnuniyetini, bağlılığını ve karlılığını artırmayı amaçlayan yenilikçi bir teknoloji olarak tanımlanmaktadır (Hung S.-Y, vd., 2010). MİY sistemi; bir işletmenin müşterileri hakkında ayrıntılı ve anlamlı bilgi edinmelerini sağlayacak yazılım ve donanıma sahip olması ve böylece müşterilerine daha kapsamlı, hedef odaklı ve kişiselleştirilmiş pazarlama sunabilmeleri anlamına gelmektedir (Tokay, 2019). MİY, müşteriler hakkında en ayrıntılı bilgileri edinmek, müşterileri çok küçük kesimler ile bölümlendirmek (mikro segmentasyon), ilgili segmentleri karlılıklarına göre ayrıştırmak, her segmente ait müşteriye ayrı ve özel pazarlama stratejisi uygulamak olarak da tanımlanabilmektedir (Kırım, 2001). Bir diğer tanıma göre de, müşteri değerinin 8 artışını ve değerli müşterilerin yaşam boyu sadık kalmasını sağlayarak tekrar satın almaya yönelmesini sağlayan, doğru araçları kullanmayı mümkün kılan bir alt yapıdır (Dyche, 2002). MİY yaklaşımı ile genel olarak müşteri tatmininin, sadakatinin arttırılması, müşterinin elde tutulmasının geliştirilmesi, müşteri ilişkilerinin karlı hale getirilmesi, farklılaşmayı ve kişiselleştirmeyi sağlama, müşteri memnuniyeti oranın artışı amaçlanmaktadır (Seymen, 2022). MİY, 1970'lerde (Buttle, 2004) şirketlerdeki satış gücü otomasyonunu yönetmek ve optimize etmek için yeni bir araç olarak ortaya çıkmıştır. Sadece satış ve pazarlama amaçları için değil, aynı zamanda daha etkili müşteri etkileşimi (King ve Burgess, 2007) ve müşteri bilgi yönetimi için kullanılan en popüler araçlardan biri haline gelmiştir. Chen ve Popovich (2003), MİY’ini, bir şirketin müşterilerini mümkün olan en iyi şekilde anlamaya çalışan, süreçlerin, insan sermayesinin ve teknolojinin entegrasyonu olarak tanımlamaktadır. Ayrıca, özellikle müşteriyi elde tutma ve ilişkiyi yönetmeye odaklanılırsa, MİY ilişki yönetimi için mevcut en yeni bütünsel yaklaşımdır. Gelişimi incelendiğinde; önce 1990’lı yılların başında birinci nesil fonksiyonel olarak MİY satış gücü otomasyonu, satış öncesi işlevleri içeren ve satış sonrası işlevleri ele alan müşteri hizmetleri ve desteği olarak bulunduğu görülmüştür. 1996’dan sonra ikinci nesil MİY; müşteriye dönük yaklaşımı benimsemiştir. Tamamen müşteri deneyimine yönelmiş, satış gücü otomasyonu ve satış sonrası hizmetleri birleştirmiş ve müşteri deneyimini tüm müşterilere ayrımsız uygulamayı benimsemiştir. 2002’li yıllara geldiğimizde MİY stratejik bir form almıştır. Müşteri portföyüne stratejik yaklaşım, gelirlerin arttırılması, maliyetlerin azaltılması irdelenmeye başlanmış ve internet teknolojileri ile MİY güçlendirilmiştir. 2008 sonrasından günümüze kadar ise stratejik MİY, çevik ve esneklik özelliği kazanmış, uzun dönemli, sürdürülebilir müşteri ilişkileri kurgulanmış, sosyal medya, E-MİY gündeme gelmeye başlamıştır (Kumar ve Reinartz, 2018). MİY boyutları açısından; analitik, operasyonel ve stratejik olarak üç başlıkta değerlendirilebilmektedir. Operasyonel MİY; müşteri ile yüz yüze, telefon, faks, e-posta gibi birebir iletişimin getirdiği süreçleri kapsamaktadır. MİY sistemi ile birçok birim kendi alanına ait müşteri bilgilerini izleyerek aksiyon almakta ve pazarlama planını 9 oluşturmaktadır (Demir ve Kırdar, 2007). Operasyonel MİY kendi bünyesinde; müşterilerin mal/hizmet alım döngüsü içinde satış öncesi ve pazarlama aşaması MİY, satış alanında MİY ve satış sonrası MİY olarak üç farklı alt başlıkta incelenebilmektedir. Satış öncesi ve pazarlama aşaması; kampanyalar, mevcut ilişkilerin güçlendirilmesi, satış alanı aşaması; müşteri ile mal/hizmet satışı için ilk ilişkiden satışın olumlu yada olumsuz oluşuna değin süreçteki yaşananları, satış sonrası ise; memnuniyet ölçümleri ve şikâyet yönetimleri gibi başlıkları içermektedir (Amuso, 2000). Analitik MİY; müşterilere ait ayrıntılı verinin toplanması, depolanması (veri ambarları), işlenerek analize hazır hale getirilmesi, veri madenciliği araçları ile analiz edilmesi, tahminlenmesi ve raporlaması işlemlerini kapsamaktadır (Payne,1993). Başka bir tanımlama ile verinin temini, kayıt altına alınması, derlenmesi-işlenmesi, bölümlendirilmesi, raporlanması, analiz ve tahminlemeye olanak tanıyacak süreçlerdir (Buttle ve Maklan 2015). MİY’in entegrasyon ve operasyon özellikleri üzerine analiz ve raporlama olanakları olunca; müşteri, müşteri iletişimleri, müşterinin ticari faaliyetleri ile ilgili tüm verilerin yorumlanarak müşteri ilişkilerinin düzenlenmesi için yapılan analiz çalışmaları analitik MİY başlığı altında toplanabilmektedir. Stratejik MİY; temelde, katma değeri olan müşterileri tutundurmaya ve benzer durumdaki yeni müşterileri sisteme dahil etmeye çalışıldığı müşteri odaklı bir yaklaşımdır. Stratejik MİY’in amacı yukarıdaki tanıma ilave olarak işletmelerin tutundurmak istedikleri müşterilerinin yaşam boyu değerinin maksimize eden pazarlama prensiplerini uygulamaktır (Iriana ve Buttle, 2007). Dolayısıyla, stratejik MİY müşterilerin farklı segmentlere ayrıldığı, müşteri değeri kavramının analizinin yapıldığı, segment-müşteri bazlı yaşam boyu değer hesaplamalarının yer bulduğu, pazarlama – satış yatırımların maliyet etkinliğinin çalışılabildiği, kayıp müşterilerin gelişiminin ve zaman içindeki değişiminin tespiti ve olası kayıpların ve/veya üretilecek değerlerin tahminlenebilmesinde kullanılabilen bir yöntemdir (Saputra, vd., 2019). 10 1.1.5. Müşteri Memnuniyeti Ölçümü ve Teknikleri İşletmeler, özellikle karlı müşterileri ellerinde tutmak, üretecekleri yaşam boyu değerden faydalanabilmek için MİY süreçlerini etkin bir şekilde gerçekleştirmeleri gerekmektedir. MYBD için müşteri sadakatinin, müşteri sadakati için de müşteri memnuniyetinin sağlanması gerektiği yapılan birçok çalışmada görülmüştür (Genoveva, 2015; Kotler, vd., 2003; Denk, vd., 2010). Giriş bölümünde değinildiği üzere; Beal (2014), yeni müşteri kazanmanın mevcut müşteriyi elde tutmaktan yedi kat daha maliyetli olduğunu ve memnuniyetsiz ayrılan müşterilerin %96’sının şikâyet başvurusunun olmadığını fakat deneyimlerini en az 15 kişi ile paylaştıklarını ortaya koymuştur. Genellikle, memnun ayrılan bir müşteri ise görüşlerini, önerilerini çevresindeki sadece iki-üç kişi ile paylaşmaktadır. Nilsen (2012) raporunda; müşterilerinin %92’sinin ağızdan ağıza pazarlamayı diğer pazarlama-iletişim kanallarını kullanmaya tercih ettiklerini, tanıdıklarından duydukları ya da müşteri bloglarından okumuş oldukları müşteri deneyimlerini daha güvenilir bulduklarını paylaşmıştır. Özellikle, hizmet sektöründeki müşterilerin memnuniyetsizliklerini dile getirmedeki yatkınlığı da göz önünde bulundurulduğunda, ağızdan ağıza pazarlama kanalı olan mevcut müşteriler, bireysel bağlılıklarının yanı sıra işletmenin büyümesinde etkin bir rol almaktadırlar. Sernovitz (2012) ve Ruby’nin (2015) yaptığı çalışmalar, memnuniyetsiz–sorunu çözülmemiş bir müşterinin potansiyel etkisini kaldırmak için yaklaşık 12 tane yeni müşteri kazanılması ya da 12 tane olumlu yorum alınması gerektiğini göstermektedir. Ayrıca, yapılan çalışmalar müşterilerden gelen şikâyetlerin doğru yönetilmesinin genel müşteri memnuniyetine olumlu etkisinin olduğunu göstermektedir (Uzun ve Özgöz, 2022). Bu doğrultuda işletmeler hizmet/mal sundukları müşterilerinin memnuniyetlerini ölçmek için öncelikle yüz-yüze, basılı anket, telefona kısa anket mesajı, telefona karekod, e- posta, canlı sohbet, sosyal medya yorumları gibi çeşitli veri toplama metotları geliştirmiştir. Sonrasında ilgili veriler; Müşteri Memnuniyet Puanı (CSAT), Müşteri Efor Puanı (CES) ve Net Tavsiye Skoru (NPS) gibi belirlenen metrikler doğrultusunda ölçülmeye başlanmıştır. İlgili metotlara aşağıda kısaca değinilmiştir. 11 Müşteri Memnuniyet Puanı (CSAT); yaklaşımında işletmeler, müşterilerinin alınan mal/hizmet sonrası farklı adımlardaki deneyimlerini ölçmek için yönelttikleri tek bir soru üzerinden “son derece memnun değil” ile “son derece memnun” arasında bir skalaya göre yanıt toplamaktadırlar. CES ve NPS'den farklı olarak CSAT puanı, bir müşterinin bir şirket ile belirli bir etkileşimden sonra yaşadığı memnuniyet derecesini ölçtüğü için mal/hizmet sunum sürecinin farklı adımlarındaki deneyimi analiz etmek için CSAT anketlerini kullanır. İşletmeler, “Bizden tekrar mal/hizmet almayı ne kadar düşünür müsünüz?” 1 pek olası değil, 5 büyük ihtimalle veya “Aldığınız hizmetten ne kadar tatmin oldunuz?” 1 son derece memnuniyetsiz, 5 son derece memnun gibi anketler İle müşteri memnuniyet oranını tanımlamaktadırlar. İlgili yöntemde memnuniyet oranı temelde, memnunum ve son derece memnunum değerlendirmesinde bulunanların toplam yanıt veren müşterilere oranı olarak hesaplanmaktadır. Müşteri Efor Puanı (CES); müşteri efor ya da çaba puanı, alınan hizmetten duyulan memnuniyet ya da hizmet sunucusunu başkalarına önerip önermeme durumundan ziyade müşterinin problemini çözmek için ne kadar efor sarfettiğini ölçmeye yönelik bir anket sorusudur. Genellikle, “Sorununuzu çözmek için ne kadar uğraştınız? Sorununuz kurumumuzda çözmek ne kadar kolaydı? Kurum sorunumun çözümünü benim için kolaylaştırdı” tarzında sorulur ve 1-5 skalasına tekabül eden 1 çok kolaydı, 5 çok zordu ya da Likert skalası 1-7 arasında değerlendirme yapılması istenir. Birden fazla hesaplama yöntemi olsa da temelde kolay ve çok kolay işaretleyenlerin toplam anket katılımcısı oranından, zor ve çok zor işaretleyenlerin oranının çıkarılmasıyla tespit edilmektedir. İşletme, yüksek bir CES puanına sahipse müşteriler için deneyimi kolaylaştırdığını, eğer CES puanı düşükse müşteri deneyimini iyileştirmek için açık bir alan olduğunu yorumlayabilmektedir. Çünkü, yapılan bir çalışmada düşük bir CES puanı olması durumunda, her ne kadar CES ile CSAT arası korelasyon yüksek olmasa da ilgili deneyimin genel müşteri memnuniyetine negatif etki yaptığını, NPS’yi etkilediğini göstermekte ve nihai olarak müşterinin mal/hizmet sunucusunu değiştirmesine sebebiyet verebildiği görülmektedir (Bleuel, 2019). 12 Net Tavsiye Skoru (NPS); Harvard İş Okulu profesörlerinden Fred Reichheld’ın 2003 yılında yazına kazandırdığı, müşterilerin hangilerinin işletmenin aleyhine, hangilerinin pasif ve hangilerinin lehine aktif rol oynayacaklarını ölçmeye yönelik olarak geliştirmiştir. İşletmemizi bir yakınınıza tavsiye eder misiniz sorusunu 0- 10’luk skala üzerinden 0 en düşük, 10 en yüksek ihtimalle tavsiye ederim ölçütleri ile değerlendirmektedir. Müşterilerin cevapları eğer 0-6 ise kötüleyenler, 7-8 pasifler, 9-10 destekleyenler olarak gruplanmaktadır. NPS, destekleyenlerin yüzdesinden, kötüleyenlerin yüzdesini çıkarmakla hesaplanmaktadır. Eğer NPS skoru sıfırın altında ise işletmenin müşteri memnuniyeti üzerine ciddi çalışmalar yapması gerektiğini göstermektedir. 0-50 arasındaki sonuçlar her ne kadar sektör pazar bazlı diğer şirketlere göre kıyaslamada farklılık gösterse de iyi bir sonuç olarak, 70 üzeri ise müşterilerin aslında birer pazarlama elamanı görülebileceği olarak yorumlanabilmektedir. NPS, ölçümlemesi günümüzde şirketler için kritik bir gösterge konumundadır. İşletmeler artan sosyal medya gücünü, ağızdan ağıza iletişime olan yüksek güvenin etkisi ile NPS puanını dikkatle takip etmektedirler. Diğer yandan denetlenmeyen ve işletmelerin kendilerince bildirdikleri ve popülaritesi artan NPS’nin, bazı pazarlarda yeni müşteriyi etkilemek için de paylaşıldığı, müşterilerce ulaşılabilir olmasının NPS’yi zedeleyecek şekilde yanlış yönlendirmelere ve suistimallere yol açtığı görülmüştür. Bu doğrultuda Fred Reicheld ve Bain Company’den Darnell ve Burns (2021) yazına, kazanılan büyüme oranı (earned growth rate) yani mevcut müşterilerin tekrar hizmet alımlarının ve refere ettiklerinin oluşturduğu gelir olarak NPS’ye ek bir parametre tanımlamışlardır (Reichheld vd, 2021). Güncel bir gelişme olan bu yaklaşımın pratik uygulamada yerini yeterince bulabilmesi için işletmelerin topladıkları veri tipini ve toplama yöntemlerini de gözden geçirmeleri gerekmektedir. Günümüzde sosyal medyanın iş ve sosyal hayatımızdaki artan yeri ile sosyal medya metrikleri de müşteri memnuniyetini ölçme ve değerlendirmede yerini almaya başlamaktadır. Müşterilerin yorumları google alerts, mention, socialmention gibi yazılımlar aracılığı ile sosyal medya taramaları yapılabilmekte ve müşterilerimizin ve/veya potansiyel kitlenin işletmeler hakkındaki yorumları toplanabilmektedir. Benzer şekilde, işletmeler SMS hizmeti almak istemeyen 13 müşteriler, reklamları web üzerinden engelleyen potansiyel müşteriler hakkında veri toplamak, analiz etmek ve bilgiye dönüştürme sonrası aksiyon planlarını şekillendirme imkânı bulabilmektedirler. Müşteri memnuniyeti üzerine yapılan çalışmalar, işletmelere, müşterilerin aldıkları mal/hizmet karşılığındaki hissiyatlarını ölçme, mal/hizmet sunumunda nerelerde iyileştirme yapılması gerektiğini anlamada ve müşterilerin yaşam boyu değerini korumak için hangi örüntüler üzerinde çalışılmasını önceliklendirme de yardımcı olmaktadır. Bir hizmet işletmesi göz önünde bulundurulduğunda, çalışanların tutum ve davranışlarının müşterilerin aldıkları hizmet algısında önemli rol aldığı, çalışanların memnuniyetlerinin ise tutum ve davranışlarını etkileyen en önemli unsurlardan olduğu bilinmektedir (Türk, 2005). Böylelikle, MİY çalışmaları ile iş süreçlerinin daha iyi anlaşılması ve ilgili sunumun müşterilerdeki yansımasının değerlendirilmesi sağlanabilmektedir. 1.1.6. Pazarlama Karması İşletmelerin pazarlama iş akışlarını etkin yönetilebilmesi adına geliştirilen pazarlama karması, adını dört temel bileşenden alır ve 4P olarak adlandırılır. 1964 yılında McCartthy tarafından yazına kazandırılan, İngilizce Product (Ürün), Price (Fiyat), Promotion (Tanıtım), Place (Dağıtım) baş harflerinden oluşmaktadır. Firmanın hedef pazardaki pazarlama gayelerini gerçekleştirmek için kullandığı pazarlama araçları seti ve pazardaki ilgili müşterilere nasıl davranılması gerektiğine yardımcı olan bir yaklaşım olarak tanımlanmaktadır (Peppers ve Rogers, 2016). Buradaki ürün bileşeninde; üretilmekte olan ürünler ile müşterilerin istek ve ihtiyaçları karşılanabilmekte midir sorusuna cevap aranmakta, fonksiyonellik, kalite, görünüm, marka, satış sonrası hizmet gibi unsurlar ön plana çıkmaktadır. Fiyat bileşeninde; müşterilerin satın almak istedikleri ürün/hizmet için ne kadarlık bir ödeme yapmayı düşündükleri sorusuna cevap aranmakta ve fiyatlar, indirimler, ödeme yöntem/kolaylıkları ön plana çıkmaktadır. Tanıtım bileşeninde; hedef müşteri kitlesinin işletme ve ürünleri hakkında ne kadar bilgi sahibi oldukları değerlendirilmekte, reklam, satış ve pazarlama unsurları ön plana çıkmaktadır. Dağıtım bileşeninde ise; ürünlerin 14 doğru zamanda, doğru yerde ve doğru miktarda müşterilere sunulup sunulmadığı sorgulanmakta, yer, lojistik ve depo yönetimi önem kazanmaktadır (Kotler ve Keller, 2005). Gelişen ve değişen ihtiyaçlar doğrultusunda pazarlama karmasına People (İnsan), Process (Süreç) ve Physical Evidence (Fiziksel Kanıt) bileşenleri eklenmiştir (Booms ve Bitner, 1982). İnsan bileşeninde; bir şirketin çalışanları, müşterilerle etkileşim kurarken, sorularını, siparişlerini ve şikâyetlerini, şahsen, çevrimiçi sohbet yoluyla, sosyal medyada veya çağrı merkezi aracılığıyla alıp işleme koyarken ön plandadır. Yolculukları boyunca müşterilerle etkileşime girmekte ve müşteri için kuruluşun "yüzü" haline gelmektedirler. Süreç bileşeni; üretim ya da hizmetin gerçekleştiği, ödeme sistemleri, dağıtım prosedürleri, müşteri ilişkilerini yönetmek gibi tüm süreci tanımlamaktadır. Gerçek prosedürleri, mekanizmaları ve akışları barındırmaktadır. Fiziksel kanıt bileşeni; marka bilinirliğini etkileyecek, şirketin sunduğu deneyimin kalitesine dair somut ipuçları sağlayan etmenlerdir. Bir kurumdaki kıyafet kodu, dokümanları, kartvizitleri, mağazanın kullandığı dekorlar, bir kafenin koltukları, oluşturduğu atmosfer ve benzeri fiziksel durumlardır. 1.2. Müşteri Kaybı (Churn) Analizi Müşteri kaybı, müşterinin hizmet aldığı sunucusundan vazgeçmesi ve başka bir hizmet sunucusuna geçmesi ile kaybedilme durumunu ifade etmektedir (Gürsoy, 2009). İşletmelerin temelde müşterilerini kaybetme nedenleri, alınan ürünün ya da hizmetin deneyimi, kalitesi, fiyatı, müşteri ihtiyaçlarının değişmesi ve mevcut kurum tarafınca sunulamaması, rekabet ortamındaki promosyonlar vb. olduğu saptanmıştır (Blattberg, vd., 2008). Müşteri kaybı ise işletmeler için, gelir kaybı, müşterinin yaşam boyu değerinden yararlanamama, ağızdan ağıza pazarlama fırsatlarını kaybetme ve negatif pazarlama sonucu yeni müşteri arayışına girme ve daha fazla maliyete katlanma gibi ciddi sonuçlar getirmektedir (Kotler, 2000). Deneyimlerinden algıladıkları beklentilerini karşılayamayan müşterilerde memnuniyetsizlikler ve buna bağlı olarak şikâyetler başlamaktadır. Müşteri şikâyetleri giderilmediğinde ise memnuniyetsizlik tatminsizliğe ve kayba 15 dönüşmektedir. Şikâyetleri giderilen müşterinin ise bağlılığı yenilemekte ve tekrar satın alma gerçekleşmektedir. Genellikle arzın yoğun olduğu hizmet sektörlerindeki müşteriler, ellerindeki seçenekler doğrultusunda kolaylıkla hizmet sunucusu değişikliğine gidebilmektedir. Hizmet sunucusundan ayrılan müşteri, kaybedilen müşteri (churn) grubuna dahil edilmekte ve bu durum alan yazınında “Churn oldu” olarak ifade edilmektedir. MKA ise müşterilerin hizmet sunucusundan ayrılış nedenlerini inceleyen analitik ve sistematik bir yaklaşımdır. Bu analizle; birçok veri madenciliği ve yapay zekâ aracından yararlanılarak potansiyel müşteri kayıplarının tahmini yapılmaya çalışılmaktadır. Bu analizi yapan bir işletmenin, kendisini terk etmiş müşterilerini ve terk etme nedenlerini saptama, bu müşteri tiplerinin özniteliklerini belirleme, terk etmesi olası müşterilerin kimler olduğunu tahmin etme, onları takip etme ve kendilerinin yapacakları aksiyonları belirleme gayreti, kısaca mevcut müşterilerini elinde tutabilme gayreti içinde olduğu söylenebilmektedir (Çiçek ve Arslan, 2020). Mevcut müşterilerin hizmet alımlarının devam etmesi, yeni müşteri bulma maliyetleri açısından kritiktir. Bu müşterilerin bugün oluşturduğu kar ile birlikte ilerideki karları ve büyümeye etkileri de beraber göz önüne alınmalı ve MYBD’nin değerlendirilmesi gerekmektedir. MKA’nın finansal etkisinin değerlendirilmesinde hem kaybedilen (churn olan) müşterinin ürettiği karı hem de kaybedilen müşterinin etkisini giderebilmek için aynı segmentteki yeni müşteri bulmanın ve sisteme dahil etmenin maliyetinin göz önünde bulundurulması gerekmektedir. Bu nedenle, mevcut müşterilerin tercih ve eğilimleri yakinen izlenmelidir. MKA ile işletmeler ellerindeki dağınık veriyi anlamlı hale getirmeye ve geçmişteki müşteri eğilimleri ile karşılaştırarak, müşteriler için kritik hizmet sunucusu değiştirme noktalarını saptamaya çalışmaktadırlar. İşletmeler, bu çalışmaların sonucunda da müşterilerinin hizmet alım yaşam döngüleri belirlemeye çalışmaktadırlar. Müşteri geri bildirimleri, şikâyetler, teknik destek geri dönüşleri, müşteri memnuniyet anketleri, fatura itirazları ve anlaşmazlıkları gibi durumlar tahmin modelleri için önemli veriler içermektedir (Şeker, 2016). Sağlık sektöründe ise hastalardan gelen şikâyetlerin ve uygulanan anketlerin analiz sonuçları çalışma için önemli destek sağlamaktadır. 16 1.2.1. Müşteri Kayıp Çeşitleri Müşteri kayıp çeşitleri gönüllü kayıp (voluntary churn) ve gönülsüz kayıp (involuntary churn) olarak iki farklı başlık altında değerlendirilebilmektedir. Gönüllü kayıp; müşterilerin kendi istekleri ile mevcut hizmet sunucusundan vazgeçerek farklı işletmelerin hizmetlerinden yararlanmayı tercih etmesi durumudur. Başka bir ifade ile rekabet nedeni ile müşterinin firmayı tercih etmeyi bırakması olarak da tanımlanabilmektedir (Nettleton, 2014). Gönüllü kayıp, MKA’ya konu olan gruptur. Örneğin; abonelik tarzındaki hizmet alım sürekliliğine dayalı bir telekomünikasyon müşterisinin hattını başka bir sunucuya taşıması, bir banka müşterisinin başka bir bankadan hizmet almaya başlaması ya da bir internet kullanıcısının başka bir sunucuya geçmesi durumunda müşteri kaybı gönüllü olarak yaşanmıştır denilebilmektedir. Bu durum genelde, müşterinin kendisi için daha avantajlı olduğuna inandığı ya da mevcut sunucunun hizmetinden memnuniyetsizlik duyduğu şartlarda gerçekleşmektedir. Gönülsüz kayıp; müşterinin kendi tercihlerinin dışında gelişen ve genelde çevresel şartlardan etkilenen kayıp durumudur. Gönülsüz kayıp müşterinin hizmet sunucusundan yararlanma şansını ortadan kalktığı durumları tanımlamaktadır (Şeker, 2016). Müşterinin farklı bir ülkeye taşınması, sağlık problemleri, vefatı vb. durumlar örnek gösterilebilmektedir. Bu grup, kontrol edilebilir ya da önlenebilir bir kayıp olmadığı için MKA’nın odağında olan bir çalışma alanı değildir. Bu tarz kayıpların göz ardı edilmesinin sebebi genelde müşteri kaybının önlenemez olmasıdır. Modellemede yanıltıcı çıktı üreteceği için model dışında bırakılmaktadır. Çoğu MKA çalışmalarında, gönülsüz kayıplar kolaylıkla saptanamadığı için genellikle zaman serisi şeklinde gönülsüz kayıplar tahmin edilmeye ve istatistiksel olarak modele eklenilmeye çalışılmaktadır (Şeker, 2016). Kayıp müşteri oranı- kayıp analizi hesaplaması 17 Kayıp müşteri oranı (churn oranı), belirli bir zaman dilimi içerisinde hizmet alımını durduran müşteri oranını tanımlamaktadır. Kayıp müşteri oranı- Kayıp analizi hesaplaması aşağıda verilmiştir; Dönemlik Kayıp Oranı (%) = (Dönem Başındaki Müşteri Sayısı − Dönem Sonundaki Müşteri Sayısı) Dönem Başındaki Müşteri Sayısı Bu oran bir örnek ile açıklanırsa; bir telekomünikasyon sunucusunun dönem (aylık) başındaki aktif müşteri sayısı 10 milyon ve dönem sonundaki müşteri sayısı 9.5 milyon olsun. Bu firmanın aylık müşteri kaybı oranı; Dönemlik Kayıp Oranı (%) = (10.000.000− 9.500.000) 10.000.000 = 5% olarak hesaplanmaktadır. Bu firmanın aylık 5%’lik müşteri kaybı yaşadığını gösterir. Kaybedilen müşterilerden doğan gelir kaybı hesaplanmak istendiğinde; örneğin, sunucunun Ocak ayı başındaki aylık tekrarlı gelir (her seferinde satış yaparak kazanılanlar değil aylık abonmanlık vs gibi her ay tekrarı olması beklenen gelirler) 10.000.000 pb, Mart ayı sonunda ise 8.500.000 pb olsun. Bu durumda; sunucunun dönemsel (çeyrek bazlı) gelir kaybı; 𝐷ö𝑛𝑒𝑚𝑙𝑖𝑘 𝐾𝑎𝑦𝚤𝑝 𝑂𝑟𝑎𝑛𝚤 (%) = (10.000.000− 8.500.000) 10.000.000 = 15% olarak hesaplanır. Diğer yandan burada göz önünde bulundurulması gereken bir nokta hizmet alımına devam eden müşterilerin ek gelir üretip üretmediğidir. Eğer mevcut müşteriler ek paket alımları ile 1.250.000 pb lik ek bir gelir üretirse bu durumda firmanın dönemsel kaybı; 𝐷ö𝑛𝑒𝑚𝑙𝑖𝑘 𝐾𝑎𝑦𝚤𝑝 𝑂𝑟𝑎𝑛𝚤 (%) = (10.000.000− 8.500.000+1.250.000) 10.000.000 = 2,5% (1.1) (1.2) (1.3) (1.4) 18 olarak hesaplanacaktır. Bu durumlar bir telekomünikasyon firmasında ek paket alımları ya da satış fiyatlarına yapılan zam gibi değerlendirilebilir. Bir başka açı ise; eğer bu ek paket kullanımlarından bir satış maliyeti oluştu ise ilgili gider yukarıdaki gelir kaybına da eklenmelidir. 1.2.2. Müşteri Kayıp Tahmini Yeni müşteri bulma ve mevcut müşteriyi elde tutma arasındaki finansal farklılık, mutsuz ayrılan müşterinin deneyimlerini birçok mecrada mutlu olan müşteriye nazaran çok daha fazla kişi ile paylaşması, MKA’yı işletmenin sürekliliği açısından kritik bir çalışma haline getirmiştir. Yeni müşteri kazanmanın yüksek maliyeti, işletmeler için olası kayıpların önceden doğru olarak tahmin edilmesi gereğini ön plana çıkarmıştır. Bu çalışmanın yapılabilmesi için ise hangi müşterinin devamlı müşteri olduğu ve hangi müşterinin hangi durumda kayıp müşteri olduğu etmenlerinin çok iyi değerlendirilip belirlenmesi gerekmektedir. Büyük müşteri portföyü olan ve dijitalleşme aksiyonlarını tamamlayan işletmeler, kayıpları önceden tahmin edebilmek amacı ile veri madenciliğine dayanan uygulamalar geliştirmektedir. Büyük veri içinden devamlı müşteri olarak tanımlanan ve belirli bir dönem içerisinde kayıp müşteri olarak kabul edilen müşterilerin segmentler halinde ve zaman serileri ile kayıp müşteri olma örüntüleri incelendiğinde, gelecekte hangi müşterinin hangi durumlarda kayıp müşteri olma riski barındırdığı, veri madenciliği modelleri aracılığı ile tahmin edilebilmektedir. Veri madenciliği kapsamında geliştirilen ilgili modeller; sınıflandırma ve regresyon, kümeleme ve birliktelik kurallarınca üç farklı kategoride değerlendirilmektedir (Özkan, 2013). Sınıflandırma ve regresyon, önceden tanımlanmış etiketleri, öğelerin örneklerine atamak için kullanılan denetimli bir öğrenme tekniğidir. Örneğin, bir bankada müşteri veri tabanında yüksek gelirli müşteriler, yüksek karlı müşteriler, düşük karlı müşteriler, banka hizmetlerini aktif kullananlar vb. tanımlamalarda kullanılmaktadır. Sınıflandırmada en yaygın olan kullanılan teknikler; Karar Ağaçları (Decision Trees), Yapay Sinir Ağları (YSA, Artificial Neural Networks), 19 Rassal Orman (RO, Random Forest), Destek Vektör Makinaleri (DVM, Support Vector Machines), Lojistik Regresyon (LR, Logistic Regression), K-En Yakın Komşular (KNN, K-Nearest Neighbors), Bayes Ağları ve Genetik Algoritmalardır (Han, Kamber ve Pei, 2012). Kümeleme, benzer örnekleri özelliklerine göre gruplandırmak için kullanılan, gruplar arasında örüntü bulunmasını sağlayan denetlenmeyen bir analiz tekniğidir. Bu modellerde genellikle, Kohonen Ağları, K-ortalama (K-means) yöntemi ve İki Adımlı (Two Step) Kümeleme teknikleri kullanılmaktadır. Birliktelik Kuralları, büyük veri kümeleri arasındaki aynı zamanda gerçekleştirilen birliktelikleri saptamak için kullanılmaktadır. Bu çalışmalarda, örneğin bir giyim alışveriş merkezindeki ya da süpermarketteki müşterinin aynı zaman diliminde satın aldıkları arasındaki örüntüyü saptama, Pazar/Market Sepeti Analizi ve müşterinin satın alma davranış paternini anlamlandırmak amaçlanmaktadır. Bu modellerde; AIS, GRI, CARMA ve Apriori şeklinde kural belirleme teknikleri yer bulmaktadır (Ersöz, 2015). MKA’da yazınında ve pratik uygulamada sıklıkla kullanılan bu teknikler takip eden bölümde paylaşılmıştır. Yapılan tahminler sonrasında, kayıp müşteri olma riski barındıran müşteriler için işletmeler indirim, hizmet sunumu ya da kapsam değişimi gibi tutundurma faaliyetleri önem kazanmakta ve kayıp müşteri olma durumunu önleyici faaliyetlerine ağırlık vermektedirler. 20 2. BÖLÜM VERİ MADENCİLİĞİ KAVRAM VE YÖNTEMLERİ Bu bölümde, bu çalışmanın konusu olan MKA’da kullanılan Veri Tabanlarında Bilgi Keşfi (VTBK) ve Veri Madenciliği (VM) süreci teorik çerçevede incelenecektir. VTBK ve VM genel olarak ele alınırken, ilerki bölümlerde gerçekleştirilecek olan sağlık sektöründe MKA uygulamasında kullanılacak VM yöntem ve algoritmaları ise ayrıntılı olarak incelenecektir. 2.1. Veri, Enformasyon, Bilgi ve Bilgelik Kavramları Yazında sıkça karşımıza çıkan ve bazen birbirinin yerine kullanılan veri, enformasyon, bilgi ve bilgelik kavramlarına açıklık getirmek, aralarındaki hiyerarşiyi incelemek önemlidir. Milan Zeleny (1987), makalesinde bu bilgi yönetimi hiyerarşisini irdelemiştir. Çalışmasında; veri, enformasyon, bilgi ve bilgelik kavramlarını know-nothing, know-what, know-how, know why, Türkçe sırası ile hiçbir şey bilmemek, ne olduğunu bilmek, nasıl olduğunu bilmek ve neden olduğunu bilmek olarak sınıflandırmıştır (Zeleny, 1987). Öncü örgütsel dönüşüm kuramcılarından Russell ve Ackoff (1989) da, ilgili bilgi yönetimi hiyerarşisine anlamak kısmını eklemiş ve bu hiyerarşiyi veri, enformasyon, bilgi, anlamak ve bilgelik şeklinde sınıflandırmıştır. Buradaki ilk dört aşama geçmiş ile, beşinci aşama ise görüş içerdiği için gelecek ile ilişkilidir. Veri; sözlük anlamı ile olgu, kavram veya komutların, iletişim, yorum ve işlem için elverişli biçimde gösterimi olarak TDK’ da yer bulmuştur. Veri, kendi başına anlam ifade etmeyen, ham, işlenmemiş gözlemlere ait nitelikleri, olayları ve ilişkili çevreleri tanımlayan sembollere, sorunu çözmemize ya da karar vermemize yardımcı olan sayı, renk, durum vb. her türlü olgu için yapılan tanımlamadır (Koçdar, 2018). Enformasyon (Information); kökeninde Latince ve İngilizce; taslak, görüş, düşünce ve haber verme anlamlarına gelmekte, Türkçe sözlük anlamı ile ise danışma, tanıtma, malumat, haber alma ve haber verme gibi anlamlar taşımaktadır. Bilişim alanında ise kurallardan yola çıkılarak veriye yöneltilen anlam, verinin organize edilmesi ve sınıflandırılması doğrultusunda 21 elde edilen anlamlandırılır veri olarak tanımlanmaktadır (Özcan, 2014). Bilginin tanımı ise verinin dönüştürülmesi ve analizi sonucunda anlamlı hale gelmesi, bir soruya cevap verecek veya karar vermeyi destekleyecek bir bağlamda sunulduğu form olarak verilebilir (Koçdar, 2018). Enformasyondan farklı olarak bilgi; bilen tarafından içselleştirilmekte genellikle kişisel ve öznel olarak tecrübe ve algıları tarafından şekillendirilmektedir. Bilgelik ise ileriyi görebilme, sağlıklı değerlendirme ve karar verme konusunda bilginin nasıl kullanılacağına ilişkin anlayış kazanma durumu olarak tanımlanabilmektedir (Durmuş, 2020). Bilgi hiyerarşisi, İngilizce’de data, information, knowledge, wisdom olarak geçen, Türkçe de sırası ile veri, enformasyon, bilgi, bilgelik olarak yer bulan verinin bilgeliğe olan dönüşümü aşağıdaki Şekil 2.1.’de gösterilmiştir (Bruyckere, 2018). Şekil 2.1.: Veri, Enformasyon, Bilgi ve Bilgeliğin Bağlantılılığı Kaynak: Bruyckere , https://theeconomyofmeaning.com/2018/06/29/the-difference- between-data-information-knowledge-and-wisdom/ Özetle, sağlanan veriler arasındaki ilişkileri anlama aşaması ile enformasyon, veriler arasındaki eğilimler, trendler ve düzenin anlaşılması ile bilgi, prensiplerin, kuralların anlaşılması, alınacak kararların ve ileriye yönelik tahminlemeye olanak tanıması ile bilgelik sağlanmaktadır. https://theeconomyofmeaning.com/2018/06/29/the-difference-between-data-information-knowledge-and-wisdom/ https://theeconomyofmeaning.com/2018/06/29/the-difference-between-data-information-knowledge-and-wisdom/ 22 2.2. Veri Tabanları Veri tabanları; birbirleri ile bağlantısı olan verilerin dijital ortamda depolandığı, saklandığı alanlardır. Veri tabanları barındırdığı büyük çaptaki veriyi yapısına uygun biçimlerde kaydetmeye, güncellemeye ve bu veri üzerinde gelişmiş sorgulamalar yapmaya olanak sağlayan yapılardır. Bir veri tabanı, genellikle bir bilgisayar sisteminde elektronik olarak depolanan yapılandırılmış bilgi veya veriden oluşan düzenli bir koleksiyondur (Zygiaris, 2018). Veri tabanları, genellikle bir Veri Tabanı Yönetim Sistemi (Database Management System) ile kontrol edilmektedir. Veri, Veri Tabanı Yönetim Sistemi (VTYS) ve aynı zamanda bunlarla ilişkili uygulama yazılımları bir araya getirildiğinde sıklıkla, yalnızca veri tabanı olarak kısaltılan Veri Tabanı Sistemi (VTS) olarak ifade edilmektedir (Zygiaris, 2018). Toplanan ilişkili çok sayıdaki veri, veri tabanlarında farklı tablo grupları halinde depolanmaktadır. İlgili tabloların mantıksal bir ilişki içerisinde tutulduğu veri tabanlarına ilişkisel veri tabanı denilmektedir. İlişkisel veri tabanı oluşturulması ve yönetilmesi için İlişkisel Veri Tabanı Yönetim Sistemlerine (Relational Database Management System) ihtiyaç duyulmaktadır. Bu veri tabanlarında İngilizcesi ile Structured Query Language (SQL), Türkçesi Yapısal Sorgu Dili kullanılmaktadır. SQL aracılığı ile veri tabanı üzerinde araştırma amaçlı sorgulamalar yapılabilmekte, kayıtlardan listeler oluşturulabilmekte, veri eklenip değiştirilebilmektedir. Veri tabanındaki bu çok sayıda veri, İngilizce yazında Big Data olarak geçen Büyük Veri’den ayrışmaktadır. Veri tabanındaki veri, sisteme dahil etmek isteyerek işlediğimiz veriyi temsil ederken, Büyük Veri (BV) ise ilişkisel veri tabanlarında tutulan yapısal verinin dışında kalan, son dönemlere dek çok da kullanılmayan, yapısal olmayan veri yığınlarını temsil etmektedir. Yapılacak farklı analizler ile buradaki değişik veri yığınından önemli enformasyon ve bilgi üretilebilmektedir. https://www.oracle.com/tr/database/what-is-database/#WhatIsDBMS https://www.oracle.com/tr/database/what-is-database/#WhatIsDBMS https://tr.wikipedia.org/wiki/%C4%B0li%C5%9Fkisel_veritaban%C4%B1 https://tr.wikipedia.org/wiki/%C4%B0li%C5%9Fkisel_veritaban%C4%B1 23 2.3. Veri Ambarları İngilizce yazında Data Warehouse olarak geçen ve 1991 yılında William H. Inmon tarafından yazına kazandırılan Veri Ambarı (VA) kavramı; analiz amaçlı sorgulamalar yapmak için birçok farklı veri tabanından alınarak birleştirilen verinin toplandığı özellikli depolardır. Günümüzde yaygın olarak kullanılmaya başlanan VA’ları günlük kullanılan veri tabanlarının birleştirilmiş ve işlemeye daha uygun bir özetini saklamayı amaçlamaktadır (Türker, vd., 2020). İlişkisel veri tabanları, olaylar ve işlemler ile ilgili verileri saklar ve sürekli bir veri giriş çıkışı gerektirirler. Dolayısıyla, güncel veriyi içerirler. Veri Ambarları ise ilgili veri tabanlarındaki veri ile diğer dış kaynaklardan toplanan veriyi belirli aralıklarla derleyip arşivlemektedir. Bu doğrultuda işletmeler için önem arz eden dönemsel analizlerin yapılmasına olanak sağlamaktadır. Veri Ambarları değerlendirilirken, analiz-sorgu kısmında OLAP (On-line Analytical Processing - Çevrimiçi Analitik İşleme) ve OLTP (On-Line Transaction Processing - Çevrimiçi İşlem Gerçekleştirme) kavramları uygulamada yer almaktadır. OLTP, çevrim içi çalışan, veri değişimi işlemlerinin çoğunlukta olduğu, sürekli ve anlık değişen operasyonel veri tabanlarındaki işlemleri kapsamaktadır. OLAP, 1993 yılında Dr. E.F. Codd tarafından geliştirilmiş ve veriler arasında fark edilemeyen ilişkileri bulup çıkartma, aynı veriyi çok boyutlu inceleme, veri ilişkilerini daha iyi görüntülemek için grafiksel sunum ve trend analizlerini gösterebilmektedir. Ayrıca, bazı fonksiyonları ile anlık karar destek mekanizmalarını güçlendirmektedir. Veri tabanlarında yapılan sorgular, günlük veya haftalık satışlar, cinsiyete göre en az / en çok satılan ürünler şeklindedir. OLAP ise; ilişkisel veri tabanlarını, rapor yazmayı ve VM’ni de kapsayan, daha ayrıntılı ve tahminlemede kullanabilen bir iş zekâsı türüdür. 2.4. Veri Madenciliği İşletmelerin işletim sistemlerinde toplanan veri çoğaldıkça, işletmeler için kaydedilen verinin işlenmesi, ellerindeki verinin anlamlandırılması önem kazanmış ve karar almada yararlanılması için İngilizce’de “Data Mining” olarak geçen Veri Madenciliği kavramı ortaya çıkmıştır. Veri Madenciliği büyük hacimli, 24 belirgin olmayan verilerden, önceden bilinmeyen fakat potansiyel olarak kullanışlı bilgi ve örüntülerin çıkarılması olarak tanımlanmıştır (Türker vd., 2020). Bir diğer tanımlamada VM; önceden bilinmeyen, veri içinde gizli, anlamlı ve yararlı örüntülerin büyük ölçekli veri tabanlarından otomatik biçimde elde edilmesini sağlayan veri tabanlarında bilgi keşfi süreci içindeki bir adım olarak tanımlanmıştır (Provost ve Fawcett, 2013). Han, Kamber ve Pei (2012) göre VM; büyük miktarlardaki veri arasından, geleceği tahminlemeye katkı sağlayacak, anlamlı ve faydalı örüntü ve kuralların bilgisayar yazılım programları yardımı ile analizi olarak tanımlanmıştır (Han vd, 2012). Capri (2015) ise, VM farklı dağınık veri türlerinden çeşitli algoritmik uygulamalar ile kullanışlı bilgi üreten yaklaşım olarak tanımlanmıştır. 2.4.1. VM Tarihsel Gelişimi VM’nin kökeni 1946 yılında tanıtılan ilk sayısal bilgisayara (ENIAC - Electrical Numerical Integrator And Calculator) kadar dayanmaktadır. 1950’li yıllarda basit düzeydeki sayma, aritmetik işlemler gibi konularda çalışabilen ilk bilgisayarlar geliştirilmiştir. Bilgisayarların yaygın kullanımda yer bulması ve veri toplanmaya başlanması ile 1960’lı yıllarda veri tabanı ve verilerin depolanması gibi kavramlar ortaya çıkmaya başlamıştır. 1960’lı yılların sonlarına doğru veri tabanları, veri depolamanın yanı sıra artan işlem yapma kabiliyetleri doğrultusunda da kullanılmaya başlanmış, bilgisayar tabanlı basit öğrenme algoritmaları kullanılmaya başlanmıştır. Minsky ve Papert (1969), yaptıkları çalışmalarda, günümüzde yapay sinir ağları olarak bilinen perseptronların basit düzeydeki kuralları öğrenebileceklerini göstermişlerdir. 1970’li yıllara gelindiğinde bilişim dünyası Codd (1970)’un, ilişkisel veri tabanları üzerine yayınlanan makalesi ile ilişkisel veri tabanları ve İlişkisel Veri Tabanı Yönetim Sistemleri ( İVTYS) ile tanışmıştır. İlgili dönemde; yapısal bir sorgu dili olan SQL, Sistem R ve Sybase gibi sorgulama dilleri geliştirilmiş, 1980’li yıllarda SQL standart dil olarak kabul görmüştür. Bu yıllarda VTYS’lerin işletmelerin gelişen ihtiyaçlarında kullanımı yaygınlaşmıştır. 1990’lı yıllara gelindiğinde Visual Basic, Excel, Access gibi programlar iş dünyasının hizmetine sunulmuştur. 25 Verinin katlanarak artması sonucu faydalı bilginin mevcut sorgu ve raporlama sistemleri ile elde edilemeyeceği görülmüş ve 1989 yılında Gregory Piatetsky- Shapiro’nun önderliğinde ilk Uluslararası Veri Tabanlarında Bilgi Keşfi (Knowledge Discovery in Databases) çalıştayı gerçekleştirilmiştir. 1991 yılında VTBK çalıştayının sonuç bildirgesi sayılabilecek “Knowledge Discovery in Real Databases: A Report on the IJCAI-89 Workshop” makalesi VTBK ile ilgili temel tanım ve kavramları ortaya koymuştur. Takibinde, VTBK için ilk VM yazılımı 1992 yılında gerçekleştirilmiştir. 1990’lı yıllarda web ortamının hayata girmesi ile birlikte 2000 yılı ve sonrasında VM ciddi bir şekilde tüm alanlarda kullanımı yaygınlaşmıştır. Fortune 500 şirketlerinin ve devlet mercilerinin alana yaptıkları büyük yatırımlar, ilgili alana olan ilgiyi daha da arttırmıştır (Dolgun, 2014). 2.4.2. Veri Madenciliği Uygulama Alanları VM çalışmaları, büyük veri setlerinde veri kayıtları arası ilişkisel–nedensel bağların belirlenmesine, anlamlandırılmasına ve karar verme sürecine ihtiyaç duyulduğu tüm alanlarda kullanılabilmektedir. Veriden bilgiye olan dönüşümde yer alan VM, pazarlama, finans, sağlık, bankacılık, MİY, eğitim gibi iş sahalarında kullanılabilmektedir. Pazarlama alanında; müşterilerin satın alma alışkanlıklarının belirlenmesi, Pazar Sepet Analizi (hangi ürünleri birlikte aldığı), pazar araştırması ve satışlara–müşterilere yönelik tahminlemeler yapılabilmektedir. Örneğin; bankacılıkta kredi kartı kullanım alışkanlıklarına göre müşterilerin sınıflandırılmasında, sigortacılıkta sigorta risk gruplarının saptanmasında ve tazminat prim oranlarının tahminlemesinde kullanılabilmektedir. MİY kapsamında; VM müşteri sadakatinin arttırılması, etkin pazarlama ve müşteri tutundurulması faaliyetlerinde sıkça yer almaktadır. Sağlık alanında da laboratuvar testleri ve hastalık riskleri, kalp verileri üzerinden kalp krizi riskleri, genetik yatkınlıktan kaynaklı kanser riskleri gibi VM uygulamalarından sıklıkla yararlanılmaktadır. Makine öğrenmesi, yapay zekâ gelişimleri ile iyice güçlenen tele-tıp, tele-monitörizasyon VM çalışmaları ile risk altındaki hastalara anlık gönderi ile destek sağlayabilmektedir. Ayrıca, veri- karar verme sürecinin olduğu 26 her sektörde veri tabanı analizi ve karar verme desteği, yönetim karar destek sistemleri VM aracılığı ile yapılabilmektedir (Lezki, 2019). 2.4.3. Veri Tabalarında Bilgi Keşfi ve Veri Madenciliği Süreci VTBK; veriden faydalı bilginin, anlamlı örüntülerin keşfedilmesi sürecinin tamamını ifade ederken, VM bu sürecin bir adımına karşılık gelmektedir. Standard bir VM süreci; verinin gürültülü ve tutarsız veriden temizlenmesi, verinin birçok veri kaynağını birleştirerek bütünleştirilmesi, analize konu olacak verinin seçilmesi ve bir VM tekniğinin kullanabilecek hale dönüştürülmesi, kayıtlı ve seçilen veriden örüntülerin çıkarılması için VM yöntemlerinin uygulanması, örüntülerin değerlendirilmesi ve kullanıcıya bilginin sunulması aşamalarını kapsamaktadır (Clifton, 2022). Şekil 2.2.’de VTBK süreci; verinin seçimi, ön işlemesi, dönüştürülmesi, örüntülerin VM aracılığı ile çıkarılması ve sonuçları yorumlama- değerlendirme ile bilgiye dönüştürülmesi süreci olarak verilmiştir (Fayyad vd., 1946, 41). Şekil 2.2: Veri Madenciliği Bilgi Keşfi Süreci Kaynak: Fayyad, vd., 1996. VTBK sürecinin, VM’nde yaygın kullanılan CRISP-DM (Cross Industry Standard Process Model for Data Mining) ve SEMMA (Sample, Explore, Modify, Model and Assess) olarak iki süreç modeli bulunmaktadır. 27 2.4.3.1. CRISP-DM CRISP – DM, VM sürecinin standartlaştırılabilmesi için 1996 yılında tasarlanmış, 1997 yılında ESPRIT (European Strategic Programme on Research in Information Technology) tarafından Avrupa Birliği projesine haline gelmiş, Daimler, Ingetral Solutions gibi öncü firmaların da desteği ile 1999 yılında ilk metodolojisi hazırlanmıştır. 2008 yılında ise CRISP-DM, SIG (Special Interest Group) 2.0 olarak güncellenmiştir (Plumed vd., 2019). Endüstriler Arası Standart İşleme –VM olarak, Türkçe yazında yer bulan CRISP- DM; iş problemlerinin veri tabanlı çözümler ile nasıl çözümlendiğini anlatmak ve iş uygulamalarının verimliliğini arttırmak amacı ile kullanılan standartlaştırılmış bir metodoloji ve süreç modeli olarak tanımlanmaktadır. CRISP-DM süreç modeli temelde; işin anlaşılması (business understanding), verinin anlaşılması (data understanding), verinin hazırlanması (data preperation), modelleme (modelling), değerlendirme (evaluation) ve uygulama-yayma (deployment) aşamalarından oluşmaktadır (Şekil 2.3). Şekil 2.3. : CRISP-DM Modeli Kaynak: Chapman vd., 2000. İlk aşama olan işin anlaşılmasında; yapılacak veri madenciliği çalışmasının neye katkı sağlamasının amaçlandığı, proje hedefinin ne olduğu, problemin 28 tanımı ve ön planı belirlenmektedir. Bir banka örneği verilirse; problem tanımı ile eldeki geçmiş veri üzerinden potansiyel Müşteri Kayıp Analizi yapmak mı, pazarlama faaliyetlerine yön verebilmek için benzer davranış gösteren ya da benzer öz nitelikteki müşterilerini sınıflandırmak mı gibi sorulara netlik kazandırılmaktadır. İşin amacı belirlendikten sonra mevcut durum değerlendirmesi, donanım, kayıtlı veri ve yazılım gibi mevcut kaynaklar ve riskler değerlendirilmektedir. Sonrasında işin anlaşılması aşamasında VM hedefleri belirlenmekte ve proje planı geliştirilmektedir (Olson ve Delen, 2008). İkinci aşama olan verinin anlaşılmasında; proje kapsamında kullanılacak verinin kalite, sayı, ulaşılabilirlik, güvenlilik, geçerlilik gibi açılardan hangi durumda olduğu değerlendirilmektedir. Temelde bu süreç, veriyi tanımak, veri kalitesini ve sorunları belirleme adımlarından oluşmaktadır. Verinin tanınması aşamasında; eldeki verilerin dağılımı, ortalama değerleri veya varsa veriler arasındaki korelasyon hakkında saptamalar yapılmakta ve veri kalitesinin doğrulanması aşamasında eldeki verinin yeterli olup olmadığı, olası farklılaşan durumları kapsama durumu, eksik ve yanlış verilerin miktarı saptanmaktadır. Bu aşamada farklı veri tabanlarındaki veriler arasında örüntü aranacaksa, olası entegrasyon sorunlarının giderilmesi gerekebilir. VM sürecinde en fazla zaman alan aşamalardan biri olan verinin hazırlanmasında; önceki aşamada verilerde saptanan eksik veriler, hatalar düzeltilir ve veri model oluşturma aşaması için hazırlanır. Bu aşama; verinin işlenmesi, sorun teşkil edebilecek eksik verilerin tahminlenerek giderilmesi, verinin ortak biçimde yapılandırılarak dönüştürülmesi, entegrasyonu, modellemelere uygun şekle getirilmesi adımlarından oluşmaktadır. Modelleme aşaması; VM’nin doğrudan dahil olduğu kısımdır. Bu aşamada tanımlanan problem ve veri kaynakları üzerinde yapılmak istenen işe en uygun makine öğrenmesi modeli veya istatistiksel model geliştirilir. Modelleme aşamasında eldeki veri, mevcut kaynaklar ve proje hedefi doğrultusunda sınıflandırma, kümeleme, birliktelik kuralları ile mi çalışılacağı, eğer sınıflandırma çalışılacaksa karar ağaçları mı, yapısal sinir ağları mı kullanılacağı, karar ağaçları ise CHAID, CART, C5.0 gibi algoritmalardan hangisinin kullanılacağı 29 belirlenmektedir. Sonrasında, modelin kalitesinin, başarısının hangi testler ile doğrulanacağı, karşılaştırma yapılacaksa hangi algoritmaların VM açısından daha başarılı sonuçlar vereceği vb. incelenmekte ve hedefe en uygun olanı seçilmektedir (Şeker, 2018). Modelleme evresindeki sonuçların VM açısından değerlendirilmesi sonrası CRISP-DM değerlendirme aşamasında, çıkan sonuçlar işin anlaşılması aşamasında belirlenen iş amaçları doğrultusunda incelenmektedir. Buradaki çıktılar, iş sahipleri yani yapılan çalışmayı kullanacaklar tarafından iş hedeflerini karşılama durumuna göre değerlendirilmekte, başlangıçta belirlenen başarı kriterlerince test edilmekte ve hedeflerin karşılanması durumunda, yapılacak son kontroller sonrası model gerçek koşullarda kullanılmak üzere uygulama aşamasına geçilmektedir. Modelin son aşaması olan uygulama-yayma; problemin çözümüne yönelik oluşturulan modelin performansının önceden belirlenen başarı kriterlerini sağlaması ve gerçek hayata uygunluğunun testi-değerlendirilmesi sonrası modelin canlıya alınması, günlük hayatta kullanılmaya başlaması aşamasıdır. Örneğin, bir sigorta şirketinde hangi müşterilerin hizmet sunucusu değiştirme ihtimalinin yüksek olduğunun belirlenmesi neticesinde, saptanan potansiyel kayıp müşterilere promosyon, satış sonrası servis, ek ürün vb. çeşitli tutundurma faaliyetleri uygulanabilmektedir. 2.4.3.2. SEMMA Sample(Örnekleme), Explore(Keşfetme), Modify(Değiştirme), Model(Modelleme) ve Assess(Değer Saptama- Değerlendirme) kelimelerinin baş harflerinden oluşan, keşifsel istatistiksel ve görselleştirme tekniklerini uygulayan, önemli tahmin edilen değişkenleri, seçmeyi, dönüştürmeyi, sonuçları ortaya çıkarmak için değişkenleri kullanarak bir model oluşturan ve doğruluğunu kontrol etmeyi kolaylaştıran oldukça yinelemeli bir süreç yönetim modelidir. Kronolojik olarak CRISP- DM’den önce ilk çıkan yöntem olan ve SAS Institute tarafından geliştirilen süreç modeli SEMMA, süreç adımları ile CRISP-DM ile 30 oldukça benzerlik göstermektedir. Aslında SEMMA yönteminin, bir anlamda CRISP-DM için geçiş süreci olduğu ve CRISP-DM’e dönüştüğü ifade edilebilmektedir. SEMMA; veri işlemenin kısıtlı imkanlar ile yapıldığı, verinin farklı amaçlara yönelik olarak bir seferde işlenmesi amacı ile geliştirilen bir geçiş modeli olarak görülmektedir (Şeker, 2018). CRISP-DM’den farkı, CRISP-DM tüm projenin metodolojisi iken SEMMA VM yapılan kısmın metodolojisidir. Şekil 2.4.: SEMMA Modeli Kaynak: Aliyeva, 2023. Örnekleme aşaması veri örnekleme, modelleme için veri seçimini kapsamaktadır. Keşfetme aşamasında; beklenen ve beklenmeyen değişkenler arasında ilişkileri ve hataları keşfederek verinin anlaşılması hedeflenir. Değiştirme aşamasında; modelleme sürecine hazırlık amacı ile veri gürültü/hata, artık, eksik veri gibi sorunlardan temizlenerek, modelde kullanılmak üzere dönüştürülür. Model aşamasında; eğilim, örüntüleri, tahminleri en iyi sağlayacak model kurulup veriye uygulanmaktadır. SEMMA’nın son aşaması olan Değer saptama– değerlendirme aşamasında; uygulanan modelin planlanan hedeflere uygunluğu değerlendirilmektedir. 31 2.4.4. Veri Madenciliğinde Karşılaşılabilen Problemler VM uzmanları büyük ölçekteki veri içeren veri tabanlarında çalışırken eksik, atık, aykırı, belirsiz veri gibi bazı sorunlarla karşılaşabilmektedirler. Başarılı bir veri madenciliği uygulaması için muhtemel sorunların giderilmesi gerekmektedir. Sistemlere veri girişi esnasında yapılan yanlış girişlerden kaynaklanan ya da veri toplanması sırasında oluşan sistem dışı hatalara, veri özellikleri ya da sınıflarındaki hatalara gürültü adı verilir. Veri tabanlarındaki eksik bilgi ve yanlışlardan dolayı VM amacına tam olarak ulaşamayabilir, ilgili gürültülerin düzeltilmesi ya da temizlenmesi gerekebilmektedir. Veri tabanlarındaki geçersiz veriler de sorun teşkil edebilmekte; değeri birincil tanımlamada yer almayan herhangi bir niteliğin değeri geçersiz ise o nitelik bilinmeyen ve uygulanamaz bir değere sahip olmaktadır. Bir başka potansiyel sorun, artık verilerdir. Verilen veri kümesi, eldeki probleme uygun olmayan, örneklem kümesi için gereksiz nitelikler içerebilir. Kurumsal çevrim içi veri tabanları dinamik olduğu için veri içeriği sürekli değişebilmektedir, bu durum bilgi keşfi için riskler barındırmaktadır. Kayıp değerler, veri toplanması aşamasında yanlış işlenen veri vb. durumlar çalışmaları etkilemektedir. Sadece sembolik ve kategorik değil tamsayı, kesirli sayılar, coğrafi bilgi vb. farklı tipteki verilerin ele alınması aşamasında da sorunlar ortaya çıkabilmektedir. Veri tabanı boyutu da çalışmaları etkileyebilen unsurlardandır (Albayrak, 2009). 2.5. Veri Madenciliği Yöntemleri VTBK ve VM işleyişindeki süreç yönetim metotları değerlendirildiğinde, VM’nin asıl dahil olduğu aşama modelleme aşamasıdır ve burada farklı stratejiler, yöntemler ve algoritmalar bulunmaktadır. Veri Madenciliğinde, Denetimli (Supervised) ve Denetimsiz (Unsupervised) yöntemler kullanılmaktadır. İlgili bu yaklaşımlar; veriyi analiz etme ve modelleme metodolojisini belirmede kullanılmaktadır. Temel olarak, VM’nde önceden net bir şekilde belirlenmiş ulaşılmak istenen bir hedef olduğunda Denetimli (supervised), elde edilmesi istenen sonuç için özel bir tanımlama yapılmamışsa veya belirsizlik söz konusu ise Denetimsiz (unsupervised) yöntemlerden yararlanılmaktadır (Hastie, vd., 2001). 32 Denetimli yöntemler, kayıtlı veriden önceden belirlenen hedef doğrultusunda bilgi ve sonuç çıkarmaya yönelik kullanılmaktadır. Bu yöntemlerde, veri üzerinden her bir sınıfa ilişkin özellikler ve ilgili özelliklerin kurallar halinde tanımlaması yapılmaktadır. Örneğin, bir telekomünikasyon şirketinde, geçmişteki veri nitelikleri ve onların nihai olarak devamlı müşteri ya da kayıp müşteri olma durumlarının analiz edilmesi ile kaybedilme olasılığı yüksek müşteriler listelenebilmektedir. Bu yöntemlere, Karar Ağaçları, RO, DVM ve YSA örnek verilebilir. Denetimsiz yöntemler, özel bir tanımlama yapılmamışsa, elde edilmesi istenilen sonuç net değil ya da belirsiz ise kullanılmaktadır. Bu yöntemlerde çok sayıdaki verinin gözlenmesi ve özellikleri arasındaki benzerliklerden hareket ederek sınıfların tanımlanması amaçlanmaktadır. Bu yöntemlerde girdi ile çıktı arasında mantıksal bağ kurulabilecek bir amaçlanan değer, çıktı olmadığı için veri içindeki benzer patern gösterenler araştırılmaktadır. Denetimsiz yöntemlere ise Hiyerarşik Kümeleme, K-Ortalamalar gibi kümeleme ve Apriori, CARMA gibi birliktelik kuralları örnek verilebilir. VM modelleri, amaçları ve gördükleri işlevlere göre temelde tahminleme ve tanımlama olarak iki ana amaç altında incelenmektedir. Tahminleyici veri madenciliği modelleri de Sınıflama (Classification) ve Regresyon (Regression) olarak ikiye ayrılmaktadır. Tanımlayıcı VM modelleri de Kümeleme (Clustering) ve Birliktelik Kuralları (Association Rules) olmak üzere iki alt başlık altında toplanabilir (Özekes, 2003). Her ne kadar modellerin kullanım alanları çok geniş olsa da genel olarak kullanımları Tablo 2.1.’de paylaşılmıştır (Karabulut, 2021). 33 Tablo 2.1..: Veri Madenciliği Modelleri ve Kullanım Alanları Modeller Kullanım Alanları Sınıflandırma & Regresyon Kayıp müşteri tahmini Satış tahminleri Üretim için sipariş tahminleri Dolandırıcılık tespiti Kümeleme Segmentasyon Sağlık alanında coğrafi risk faktörleri Ürün satış profili Birliktelik Pazar sepet analizi Promosyon analizi Katalog ve yerleşim düzeni VM’nin veri tabanlarından sağlanan büyük veri ile çalışabilmesi, yukarıda değinilen tahminleyici, tanımlayıcı yöntemlerin uygulanabilmesi için çeşitli veri madenciliği yazılımlarına ve programlarına ihtiyaç duyulmaktadır. Endüstride farklı programlar bulunsa da yazında yapılan birçok çalışmada IBM SPSS Modeller, WEKA, Clementine, RapidMiner, Knime, Keel, ve Orange gibi paketlerin kullanıldığı görülmüştür (Yıldız ve Şeker, 2016). 2.5.1. Sınıflandırma ve Regresyon Modelleri Sınıflandırma ve regresyon modelleri, sonuçları bilinen verilerden hareket edilerek bir model geliştirilmesini ve kurulan modellerden yararlanılarak, sonuçları bilinmeyen veri kümeleri için sonuç değerlerinin tahmin edilmesini amaçlanmaktadır. Örneğin bir banka, önceki dönemlerde vermiş olduğu kredilere ilişkin verilere ait kredi alan müşterilerinin özellikleri ve geri ödeme durumu arasındaki örüntüyü inceleyip, yeni kredi başvurusunu değerlendirirken, modelin tahminlemesi ile ilgili müşterisinin geri ödeme durumunu tahminleyebilmektedir. Tahminleyici VM yöntemleri arasındaki Sınıflandırma ve Regresyon modellerindeki temel fark, bağımlı değişkenin sürekli veya kategorik özellik barındırmasıdır. Sınıflandırmada tekniklerinden kategorik değerleri, regresyondan süreklilik özelliği taşıyan değerleri tahminlerken yararlanılmaktadır (Öztürk, 2014). Aşağıda sınıflandırma tekniklerinden Karar Ağaçları (çalışmada 34 kullanılmıştır), YSA, LR, RO, DVM, Bayes Ağları, K-En Yakın Komşu ve Genetik Algoritmalara daha ayrıntılı yer verilmiştir. 2.5.1.1. Karar Ağaçları Karar Ağaçları, belirlenen bir amaca ulaşma olasılığı en yüksek olan stratejiyi belirlemeye, tercihlerin, risklerin ve kazançların tanımlanmasına yardımcı olabilen, birbirini izleyen bağlı olaylar arasında örüntüleri tespit edebilen ve tahminlemede kullanılan bir yöntem olarak tanımlanmaktadır. Karar veriye, karar verirken hangi faktörlere dikkat edilmesi gerektiğinin anlaşılmasında ve her bir faktörün kararın farklı çıktıları ile geçmişte nasıl bir örüntüsünün olduğunun tespitinde yardımcı olmaktadır (Bounsaythip ve Esa, 2001). Karar Ağaçları kök, düğüm ve yapraklardan oluşur. En iyi bölen kestirici – kök hücre ile dallanma başlayıp, bu işlem belirlenen a