T.C. ULUDAĞ ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ EKONOMETRİ ANABİLİM DALI İSTATİSTİK BİLİM DALI MAKROEKONOMİK ZAMAN SERİSİ ANALİZİ VE YAPAY SİNİR AĞI UYGULAMALARI (DOKTORA TEZİ) Özer ARABACI BURSA, 2007 T.C. ULUDAĞ ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ EKONOMETRİ ANABİLİM DALI İSTATİSTİK BİLİM DALI MAKROEKONOMİK ZAMAN SERİSİ ANALİZİ VE YAPAY SİNİR AĞI UYGULAMALARI (DOKTORA TEZİ) Özer ARABACI Danışman: Prof. Dr. Mustafa AYTAÇ BURSA, 2007 ii T. C. ULUDAĞ ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ MÜDÜRLÜĞÜNE Ekonometri Anabilim/Anasanat Dalı, İstatistik Bilim Dalı’nda U2004085 numaralı Özer ARABACI’nın hazırladığı “MAKROEKONOMİK ZAMAN SERİSİ ANALİZİ VE YAPAY SİNİR AĞI UYGULAMALARI” konulu Doktora Tezi Çalışması ile ilgili tez savunma sınavı, 27/11/ 2007 günü 12:00- 14:00 saatleri arasında yapılmış, sorulan sorulara alınan cevaplar sonunda adayın tezinin/çalışmasının BAŞARILI (başarılı/başarısız) olduğuna OYBİRLİĞİ (oybirliği/oy çokluğu) ile karar verilmiştir. Sınav Komisyonu Başkanı Prof. Dr. Ercan DÜLGEROĞLU Uludağ Üniversitesi Üye (Tez Danışmanı) Prof. Dr. Mustafa AYTAÇ Uludağ Üniversitesi Üye Prof. Dr. Nemci GÜRSAKAL Uludağ Üniversitesi Üye Prof. Dr. Ercan DÜLGEROĞLU Uludağ Üniversitesi Üye Prof. Dr. Erkan IŞIĞIÇOK Uludağ Üniversitesi Üye Prof. Dr. Şehamet BÜLBÜL Marmara Üniversitesi Ana Bilim Dalı Başkanı Prof. Dr. Nemci GÜRSAKAL 27/11/ 2007 Enstitü Müdürü Prof. Dr. Mustafa AYTAÇ iii ÖZET Yazar : Özer Arabacı Üniversite : Uludağ Üniversitesi Anabilim Dalı : Ekonometri Bilim Dalı : İstatistik Tezin Niteliği : Doktora Tezi Sayfa Sayısı : XII + 197 Mezuniyet Tarihi : …. /…. / … Tez Danışman(lar)ı : Prof. Dr. Mustafa AYTAÇ Makroekonomik Zaman Serisi Analizi ve Yapay Sinir Ağı Uygulamaları Son yıllarda zaman serisi analizinde yapay sinir ağı modellerinin kullanımına ilgi artmaktadır. Doğrusal dışı modelleme başarısı, veri setinden öğrenebilme yeteneği ve veri yaratma sürecine kısıt getirmemesi gibi özellikler yapay sinir ağı modellerini çekici kılmaktadır. Diğer taraftan farklı bir terminolojiye sahip olması ve parametrik olamayan doğası ise bir dezavantaj olarak görülmektedir. Bu çalışmada iktisadi zaman serilerinin sahip olduğu farklı anahtar özellikler durumunda yapay sinir ağı modellerinin kullanımının uygunluğu araştırılmaktadır. Bu amaçla mevsimsellik, yapısal kırılma, volatilite ve doğrusal dışılık gibi özelliklere sahip farklı zaman serileri kullanılmıştır. İlk olarak bu seriler sahip oldukları bu anahtar özellikler durumda kullanılan geleneksel modellerle modellenmiştir. İkinci olarak ilgili seriler yapay sinir ağı modelleriyle modellenmiş ve önraporlama performansları karşılaştırılmıştır. Elde edilen sonuçlar volatilite dışında diğer durumlarda yapay sinir ağı modellerinin kullanılabileceğini destekler yöndedir. Anahtar Sözcükler: Zaman Serileri, Yapay Sinir Ağı, İleri Beslemeli Ağ, ARIMA Modelleri, Önraporlama iv ABSTRACT Yazar : Özer Arabacı Üniversite : Uludağ Üniversitesi Anabilim Dalı : Ekonometri Bilim Dalı : İstatistik Tezin Niteliği : Doktora Tezi Sayfa Sayısı : XII + 197 Mezuniyet Tarihi : …. /…. / … Tez Danışman(lar)ı : Prof. Dr. Mustafa AYTAÇ Macroeconomic Time Series Analysis and Artificial Neural Networks Applications There is an increasing interest in time series analysis using artificial neural networks models (ANN) in recent years. ANN models are attractive because of their nonlinear modelling success, learning from data capability. On the other hand it is a disadvantage that it has a different nomenclature and nonparametric nature. In this study it was investigated that in which cases it is usefull to use ANN models in economic time series analysis. For this purpose, some economic time series which have different key features such as seasonality, structural break, volatility and nonlinearity are used. Firstly these series are modelled by using traditional methods. Secondly same series are modelled by using ANN models and forecasting performance of those models are compared. Results are supported that except for volatility, ANN models can be used as a time series analysis method. Key Words:Time Series, Artificial Neural Networks, Feedforward Networks, ARIMA Models, Forecasting. v İÇİNDEKİLER TEZ ONAY SAYFASI i ÖZET ii ABSTRACT iii İÇİNDEKİLER iv TABLOLAR v ŞEKİLLER vii GİRİŞ 1 BİRİNCİ BÖLÜM ZAMAN SERİSİ ANALİZİNDE ANA BAŞLIKLAR I. ANAHTAR ÖZELLİKLER 4 A. DURAĞANLIK KAVRAMI 4 B. TREND 6 1. Gecikme Yapısının Belirlenmesi 10 2. Dickey-Fuller ve Genişletilmiş Dickey-Fuller Testleri 11 C. MEVSİMSELLİK 13 1. Periyodik Otoregresif Model 14 2. Periyodik Otoregresif Modelde Birim Kök Testi 16 D. YAPISAL KIRILMA 17 E. VOLATİLİTE MODELLEMESİ 21 1. ARCH 22 2. GARCH 23 F. DOĞRUSAL DIŞILIK 25 1. Eşik Değer Otoregresif Model (TAR) 28 2. Düzgün Geçiş Modelleri (STAR) 32 II. ÖNRAPORLAMA 36 vi İKİNCİ BÖLÜM YAPAY SİNİR AĞLARINA GİRİŞ VE TEMEL MODELLER I. YAPAY SİNİR AĞLARINDA TARİHSEL GELİŞİM 44 II. YAPAY SİNİR AĞLARINDA TERMİNOLOJİ VE TEMEL MODELLER 48 A. YAPAY SİNİR AĞLARINDA TEMEL YAPI VE ELEMANLAR 48 B. McCULLOCH – PITTS MODELİ 52 C. BASİT ALGILAYICI MODELİ 54 D. ADAPTİF DOĞRUSAL ELEMAN AĞI 64 ÜÇÜNCÜ BÖLÜM YAPAY SİNİR AĞI MODELLERİNİN ZAMAN SERİSİ ANALİZİNDE KULLANIMI I. ÖĞRETMELİ ÖĞRENME STRATEJİSİ 74 II. ÇOK KATMANLI ALGILAYICILAR 80 III.TAHMİN 88 A. GERİ YAYILIM ALGORİTMASI 89 B. DOĞRUSAL OLMAYAN EN KÜÇÜK KARELER 96 IV.AĞ SEÇİMİ 100 A. TEORİK BİLGİ KRİTERLERİ 105 1. Schwarz Bilgi Kriteri 105 2. Akaike Bilgi Kriteri 106 B. DİĞER YAKLAŞIMLAR 107 1. Çapraz Geçerlilik 107 2. Erken Durdurma Metodu 108 3. Hata Kriterlerinin Kullanımı 109 V. GERİ DÖNÜŞÜMLÜ AĞLAR 110 VI. YAPAY SİNİR AĞLARI İLE ZAMAN SERİSİ ANALİZİNE YENİDEN BAKIŞ 112 vii DÖRDÜNCÜ BÖLÜM TÜRKİYE EKONOMİSİNE AİT DEĞİŞİK ZAMAN SERİSİ ÖZELİKLERİ GÖSTEREN MAKRO EKONOMİK SERİLER ÜZERİNDE YAPAY SİNİR AĞI MODELLERİNİN PERFORMANSLARININ ÖLÇÜLMESİ I. YÖNTEM 121 II. MEVSİMSELLİK İÇEREN BİR SERİ OLARAK ÖZEL NİHAİ TÜKETİM SERİSİNİN MODELLENMESİ 123 III. İMKB-100 HAFTALIK GETİRİLERİ İÇİN VOLATİLİTE MODELLEMESİ 135 IV. YAPISAL KIRILMA GÖSTEREN BİR SERİ OLARAK SANAYİ ÜRETİM ENDEKSİNİN MODELLENMESİ 148 V. KAPASİTE KULLANIM ORANLARI SERİSİNDE DOĞRUSAL DIŞILIĞIN MODELLENMESİ 158 VI. AĞIRLIKLANDIRILMIŞ PENCERE YÖNTEMİYLE HAM PETROL VARİL FİYATLARININ ÖNRAPORLANMASI 168 SONUÇ 175 TERİMLER SÖZLÜĞÜ 183 ÖZGEÇMİŞ 198 viii TABLOLAR Tablo 1: Önraporlama Performansı Ölçütleri 39 Tablo 2: “VE”, “VEYA”, “VE DEĞİL” Problemleri 55 Tablo 2: XOR Problemi 56 Tablo 3: “VE” Problemi 59 Tablo 4: “VEYA” Problemi 67 Tablo 6: Uygun PEAR (p) Modelinin Seçimi 126 Tablo 7: PEAR (1) Modeli Örneklem içi Önraporlama Ölçütleri 128 Tablo 8: NONT Serisi İçin Ağ Seçimi 130 Tablo 9: 5-4-1 FNN Modeli Örneklem içi Önraporlama Ölçütleri 132 Tablo 10: Özel Nihai Tüketim İçin Gerçekleşen Değerler ve Expost Önraporlama Performansları 133 Tablo 11: İMKB 100 Serisi Getirileri (R) İçin ADF Testi 136 Tablo 12: İMKB 100 Serisi Getirileri İçin En İyi Ortalama Modeli 137 Tablo 13: İMKB 100 Serisi Getirileri İçin ARCH LM Testi 138 Tablo 14: İMKB 100 Haftalık Getiri Serisi İçin Model Tahminleri 139 Tablo 15: İMKB 100 Haftalık Getiri Serisi İçin 3-4-1 FNN Önraporlama Performans Ölçütleri 146 Tablo 16: SÜE Serisi İçin ADF Testi 149 Tablo 17: SÜE Serisi İçin Peron 1997 testi 150 Tablo 18: SÜE∆ Serisi İçin Model Tahminleri 152 Tablo 19: ∆ SUE Serisi İçin Ağ Seçimi 154 Tablo 20: ∆ SUE İçin 4-6-1 FNN Önraporlama Performans Ölçütleri 155 Tablo 21: ∆ SUE İçin Gerçekleşen Değerler ve Expost Önraporlama Performansları 156 Tablo 22: KKO Serisi İçin ADF testi 159 ix Tablo 23: Uygun ARMA(p,q) Modelinin Seçimi 159 Tablo 24: ARMA(3,2) Modeli 160 Tablo 25: KKO İçin 2-3-1 FNN Önraporlama Performans Ölçütleri 162 Tablo 26:Eşik Değer Modeli İçin En Uygun Modelin Belirlenmesi 163 Tablo 27: KKO İçin TAR Modeli Önraporlama Performans Ölçütleri 164 Tablo 28: LSTAR Model Spesifikasyonunun Belirlenmesi 165 Tablo 29: KKO İçin LSTAR Önraporlama Performans Ölçütleri 166 Tablo 30: KKO İçin Ex-post Önraporlamalar 167 Tablo 31: COP için ADF Testi 169 Tablo 32: 2-3-1 İleri Beslemeli Ağı için Bazı Değerlendirme Ölçütleri 172 Tablo 33: Çekirdek COP için ADF testi 172 Tablo 34: AR(2) Modeli için Bazı Değerlendirme Ölçütleri 173 Tablo 35: COP Serisi için Gerçekleşen Değerler ve Expost Önraporlamalar 174 x ŞEKİLLER Şekil 1: Deterministik ve Stokastik Trende Sahip İki Seri 9 Şekil 2: Yapısal Kırılmalı Bir Seri 18 Şekil 3: Önraporlama ile İlgili Ana Kavramlar 37 Şekil 4: Biyolojik Bir Sinir Hücresinin Yapısı 49 Şekil 5: Yapay Bir Sinir Hücresinin Yapısı 50 Şekil 6: McCulloch – Pitts Yapay Sinir Hücresi 52 Şekil 7: (a) Ve – (b) Veya – (c) Ve değil Problemleri 55 Şekil 8: XOR Problemi 56 Şekil 9: Basit Algılayıcı Modeli 57 Şekil 10: Teorik Bir Sınıflandırma Problemi Çözümü 58 Şekil 11: “VE” Problemi 60 Şekil 12: “VE” Probleminin Basit Algılayıcı İle Çözümü 63 Şekil 13: ADALİNE Ünitesi 64 Şekil 14: “VEYA” Problemi 67 Şekil 15: “VEYA” Probleminin ADALİNE İle Çözümü 71 Şekil 16: İki Adaline Ünitesinden Oluşan Madaline Ağı 72 Şekil 17: Üç Katmanlı Algılayıcı 81 Şekil 18: İki Katmanlı İki Gizli Üniteli İleri Beslemeli Ağ 82 Şekil 19: Sıklıkla Kullanılan Transfer Fonksiyonları 83 Şekil 20: Problem Karmaşıklığı 85 Şekil 21: 3-2-1 İleri Beslemeli Ağ 86 Şekil 22: 3-2-1 İleri Beslemeli Ağı (Fonksiyon Gösterimi) 87 Şekil 23: Belirli Bir Aralıkta Fonksiyon Kompleksliği 102 xi Şekil 24: 1-3-1 Ağ ile Çeşitli Fonksiyonlara Yakınsama 103 Şekil 25: 1-5 -1 Ağı ile h = cos (9x+2) Fonksiyonuna Yakınsama 103 Şekil 26: Genelleştirme Problemi 104 Şekil 27: Erken Durdurma Metodu 108 Şekil 28: Kısmi Geri Dönüşümlü Ağ 110 Şekil 29: Kayan Pencere Yöntemi 116 Şekil 30: Özel Nihai Tüketim (1987Q1 - 2005:Q4) 124 Şekil 31: Özel Nihai Tüketim: Çeyrekler Bazında Ortalamalar 124 Şekil 32: Özel Nihai Tüketim: Kısıtlı Model Kalıntı Kareler 125 Şekil 33: Özel Nihai Tüketim: Kısıtsız Model Kalıntı Kareler 126 Şekil 34: Özel Nihai Tüketim – PEAR(1) Modeli Önraporlama Performansı 127 Şekil 35: NONT Serisi 129 Şekil 36: Özel Nihai Tüketim 5-4-1 FNN Modeli Önraporlama Performansı 131 Şekil 37: Özel Nihai Tüketim İçin Expost Önraporlama Performansları 133 Şekil 38 : İMKB 100 Haftalık Getiri (20.07.1987-09.04.2007) 136 Şekil 39: İMKB 100 Haftalık Getirileri İçin Ortalama Modeli Önraporlaması 140 Şekil 40: İMKB 100 Haftalık Getirileri İçin Varyans Modeli Önraporlaması 140 Şekil 41: 2-3-1 FNN Cross Validation Eğitim Performansı 142 Şekil 42: 3-4-1 FNN Cross Validation Eğitim Performansı 143 Şekil 43: 2-5-1 FNN Cross Validation Eğitim Performansı 144 Şekil 44: 3-5-1 FNN Cross Validation Eğitim Performansı 145 Şekil 45: 3-4-1 FNN Ağı ile İMKB-100 Haftalık Getirilerinin Önraporlaması 146 Şekil 46 : Sanayi Üretim Endeksi (1980Q1-2006Q3) 149 Şekil 47 : Sanayi Üretim Endeksi Birinci Farkı (1980Q2-2006Q3) 151 Şekil 48: ARMA (3,4) Örneklem İçi Önraporlama Değerleri 153 Şekil 49 : Ağın Eğitiminde İterasyonlar Boyunca MSE değişimi 154 xii Şekil 50 : 4-6-1 FNN Örneklem İçi Önraporlama Değerleri 155 Şekil 51: ∆ SUE Serisi İçin Gerçekleşen Değerler ve Expost Önraporlamalar 156 Şekil 52: Kapasite Kullanım Oranları (02.1991-12.2006) 158 Şekil 53: ARMA(3,2) Modeli Örneklem İçi Önraporlaması 160 Şekil 54: 2-3-1 FNN İçin Cross Validation Yönteminde Erken Durdurma 161 Şekil 55: 2-3-1 FNN ile KKO serisi Örneklem İçi Önraporlama 162 Şekil 56: TAR ile KKO Serisi Örneklem İçi Önraporlama 164 Şekil 57: LSTAR ile KKO Serisi Örneklem İçi Önraporlama 166 Şekil 58: Ham Petrol Varil Fiyatları Ocak 1991-Mayıs 2007 168 Şekil 59: Ham Petrol Varil Fiyatları Kasım 2001-Mayıs 2007 170 Şekil 60: 2-3-1 FNN ile COP Serisi Örneklem içi Önraporlama 171 Şekil 61: AR(2) Modeli ile COP Serisi Örneklem içi Önraporlama 173 Şekil 62: COP Serisi Gerçekleşen Değerler ve EXPOST Önraporlamalar 174 1 GİRİŞ Modern hayatın gösterdiği gelişim ve bu gelişimin hızı karşısında her alanı daha karmaşık hale gelen günlük yaşam, geleceğe bakışın daha güvenilir olmasını gerektirmektedir. Bu nedenle geleceğe ait planların ve bu planlar için gerekli tahminlerin daha tutarlı bir şekilde yapılması son derece önemlidir. Bu önemin bir parçası olarak, iktisadi serilerin önraporlamalarındaki tutarlılık iktisadi birimlerin politika hedeflerini oluşturmalarında hayati bir bileşendir. Bu anlamda son 10 yılda popülaritesi her geçen gün artmakta olan Yapay Sinir Ağı Modellerinden yeni ve kullanışlı bir modelleme aracı olarak sıklıkla söz edilmektedir. Yüksek örüntü tanıma kabiliyeti, evrensel yakınsayıcı özelliği ve bu nedenle de her tür karmaşık ilişkiyi yakalayabilme yeteneği, regresyon yaklaşımının tersine veri setinin dağılımına ve tahmin edilecek parametrelerin doğrusallığına ilişkin herhangi bir varsayım gerektirmemesi gibi çekici özelliklerinin yanında, kendine özgü farklı bir terminolojisinin olması, tüm sürecin bilgisayarlarda işlediğine dair kara kutu yakıştırması, parametrelerinin yorumlanamaması gibi dezavantajları da olan bu modelleme ailesinin daha yakından incelenmesi gerekmektedir. Bu tez çalışmasında “zaman serisi analizinde yapay sinir ağları yararlı bir analiz aracı olarak kullanılabilir mi?” sorusunun cevaplanması temel problematik olarak ele alınmıştır. Bu nedenle çalışmanın bakış açısı zaman serilerinin sahip olduğu bazı anahtar özellikler üzerinden şekillenmiştir. Bu anahtar özellikler çalışmada trend, mevsimsellik, volatilite, yapısal kırılma ve doğrusal dışılık olarak ele alınmıştır. Böylece ilk bölümde bu özellikler, bu özellliklere sahip zaman serilerinin tanımlanması için gerekli testler, kullanılabilecek zaman serisi modelleri ve önraporlama üzerinde durulmuştur. İkinci bölümde yapay sinir ağı modellerinin kendine özgü terminolojisi, tarihsel gelişimi ve temel modellerin tanıtılması hedeflenmiştir. Böylece zaman serisi analizinde kullanılan yapay sinir ağı modellerinin incelenebilmesi için bir 2 alt yapı hazırlanmıştır. Özellikle tek bir nöronun ve buna bağlı olarak da temel modellerin nasıl çalıştığı üçüncü bölümde ele alınan daha karmaşık ağ yapılarının anlaşılması için önem arz etmektedir. Üçüncü bölümde, zaman serisi analizinde kullanılan yapay sinir ağı modelleri öğretmenli öğrenme stratejisini kullandıkları için, istatistiksel öğrenme teorisi kısaca tanıtılmış, daha sonra da Çok Katmanlı Algılayıcılar ve Geri Dönüşümlü Ağlar tartışılmıştır. Bu tartışmada tahmin, katman sayısı ve katmanlarda yer alacak nöron sayısı problemleri ön planda tutulmuştur. Bu bölümde son olarak, yapay sinir ağı modellerinin zaman serisi analizinde kullanımı için adımsal bir süreç sunulmuştur. Son olarak dördüncü bölüm olan uygulama bölümünde, Türkiye ekonomisine ait ve yukarıda sözü edilen anahtar özelliklere sahip seriler üzerinde yapay sinir ağı modellerinin performansları birinci bölümde tartışılan zaman serisi modellerinin performanslarıyla karşılaştırılmıştır. Böylece, zaman serisi analizinde yapay sinir ağı modellerini kullanmanın avantajlı olduğu durumların belirlenmesi hedeflenmiştir. 3 BİRİNCİ BÖLÜM ZAMAN SERİSİ ANALİZİNDE ANA BAŞLIKLAR Makroekonomik veriler eşit aralıklı zaman noktalarında ölçülmüş istatistiklerden oluşmaktadır. Bu istatistikler genellikle haftalık, aylık, üç aylık, yıllık şekilde derlenirler. Bu nedenle makroekonomik veriler üzerinden yapılacak analizler çoğunlukla zaman serisi analizi yaklaşımı çerçevesinde şekillenir. Ele alınan bir zaman sersinin diğer serilerden en önemli farkı, içerdiği gözlem değerlerinin bir sıraya sahip olmasıdır. Verilerin bir zaman sırasına göre ele alınması, arka planda bir veri yaratma süreci mantığına işaret eder. Bu nedenle ele aldığımız serinin stokastik bir süreç olduğu düşünülür. İşte bu durumda tek değişkenli zaman serisi yaklaşımı açısından problem, serinin durağan bir stokastik süreçle ifade edilip edilemeyeceğidir. Eğer seri durağan bir stokastik süreçle ifade edilemez ise değil karmaşık istatistiksel modelleme tekniklerin kullanımı, basit moment tahminlerinin yapılaması bile sakıncalıdır. Böylece durağanlık testlerine olan ilgi başlamıştır. Aslında son 15 - 20 yılda tek değişkenli zaman serisi analizi başlığı altında çığ gibi büyüyen bu literatürün test etmeye çalıştığı, zaman serilerinin hemen hepsinin sahip olduğu anahtar bazı özelliklerin, ilgili serinin durağan bir stokastik süreçle ifade edilebilmesini etkileyip etkilemediğidir. Bu anahtar özellikler Trend, Mevsimsellik, Kırılma, Volatilite ve Doğrusal dışılıktır. Sonuçta bu bölümde ele alınacak başlıklar bu anahtar özeliklerden oluşacaktır. Öte yandan yukarıda da belirtildiği gibi, durağanlığın test edilmesi ile ilgili literatür geniş bir başlık olduğundan, konu burada sadece uygulama bölümünde Türkiye ekonomisine ilişkin kullanılacak serilerin gösterdikleri özelliklerle sınırlandırılmıştır. 4 I. ANAHTAR ÖZELLİKLER Yukarıda belirtildiği gibi zaman serileri analizinin tarihsel hikayesi zaman serilerinin gösterdiği ana özelliklerin modelleme konusunda ortaya çıkardıkları problemlerin çözümlenmesi paralelinde şekillenmiştir. Bu nedenle de tek bir model çerçevesinde konuyu ele alabilme yaklaşımı yetersiz kalmaktadır. Bu başlık altında ele alınacak konular, zaman serilerinin gösterdikleri farklı özelliklerin uzun uzun tartışılmasından ziyade, söz konusu özelliklerin farklı modellerle nasıl ele alınabileceğinin üzerinde durmaktadır. Çünkü doğru modelin seçimi ve buna bağlı olarak doğru öngörülerin elde edilmesi, bu tezin asıl problematiği olan “Yapay sinir ağlarının ekonomik zaman serilerinde bir analiz aracı olarak yararlı bir şekilde kullanılabilir mi?“ sorusunun cevabının alınmasında son derece önemli bir yer teşkil etmektedir. A. DURAĞANLIK KAVRAMI Durağanlık varsayımı, ilgili serinin olasılık yoğunluk fonksiyonunun zaman içerisinde değişmediğinin varsayımıdır. Serinin olasılık yapısı zaman içerisinde sabit kalıyorsa seri durağandır (Pindyck ve Rubinfeld, 1981, s.497). Durağanlık varsayımının kullanımı bazen değişik şekillerde karşımıza çıkabilmektedir. Çünkü pratikte yukarıdaki varsayım çok kısıtlayıcı olabilmekte ve test edilememektedir. Bu nedenle bir serinin ilk iki momentinin yani ortalamasının [E(yt) = yµ tüm t için], ve varyansının [Var(yt) = 2 yσ tüm t için], zaman boyunca değişmemesi ve yt’nin kendi tüm gecikmeli değerleri ile olan kovaryansının zaman boyunca sabit olması [Cov(yt,yt+k) = kγ ] koşullarının yerine gelmesi zayıf durağanlık olarak adlandırılır. Ayrıca bu duruma kovaryans durağanlık yada ikinci dereceden durağanlık da denilmektedir. Durağanlıkla ilgili bir başka kavram trend durağanlıktır. Durağan olan bir zaman serisi ty ’nin, sahip olduğu deterministik trendin etkisiyle ortalamasının değişmesi ile seri durağan 5 dışı bir yapı gösterebilir. Bu durumda şöyle bir model, t ty tµ φ ε= + + ileri sürülebilir. Eğer deterministik trend serinin durağan olmasını engelliyorsa, bu modelle trend etrafında µ ortalamalı bir durağan stokastik süreç tε tarafından açıklanıyor olacaktır. Sıklıkla kullanılan bir diğer kavram fark durağanlıktır. Eğer seri stokastik bir trende sahipse yada bir başka ifade ile rassal yürüyüş olarak tanımlanıyorsa bunun anlamı serinin belirli bir ortalama etrafında saçılmadığı ve sabit bir varyansa sahip olmadığıdır. Bu durumda stokastik trend yapısının dışlanmasıyla seri durağanlaştırılabilir. Bu işlem fark alma işlemidir. Rassal yürüyüş serisi, 1t t ty y ε−= + ise, her iki tarafın birinci farkı alındığında, 1t t ty y ε−− = t ty ε∆ = olur. Böylece, 2 (0, )t iid εε σ∼ olduğundan fark serisi durağan süreçle aynı yapıda olur. Kısaca, fark alınarak durağanlaşan seriler fark durağan seri olarak adlandırılırken, deterministik trentden sapmaların durağan olduğu seriler ise trend durağan seriler olarak adlandırılır (Chatfield, 1997, 462). Son olarak durağan süreçler I(0) yani sıfırıncı dereceden entegre, bir fark alındığında durağan olan süreçler I(1) yani birinci dereceden entegre ve iki fark alındığında durağanlaşan süreçler ise I(2) yani ikinci dereceden entegre süreçler olarak adlandırılırlar. 6 B. TREND Ekonomik zaman serileri için en sık rastlanan ortak özellik pozitif bir trende sahip olmaktır. Elbette bunun en büyük nedeni, iktisadi büyüklüklerin nüfus artışı, teknolojik gelişmeler vb. nedenlerden dolayı artma eğiliminde olmasıdır. ty serisi birinci dereceden otoregresif bir yapıya sahip olsun, yada diğer bir ifade ile AR(1) süreci ile temsil edilsin, bu durumda, 1 1t t ty yφ ε−= + burada, 20( , )t εε σ∼ iid dir. Ekonomik zaman serileri için genel olarak 1φ katsayısının alabileceği değerler 0≤ 1φ ≤1 arasındadır. Çünkü 1φ <0 durumunda seri sönen bir seriye dönecektir. Öte yandan 1φ >1 durumunda ise seri limitsiz olarak büyür (Patterson, 2000, s.209). 0≤ 1φ ≤1 şeklindeki genel duruma dönülecek olursa burada gözlemlenebilecek iki özel değer söz konusudur. Bunlar 1φ = 0 ve 1φ = 1 durumlarıdır. 1φ = 0 durumunda, t ty ε= olacaktır. 20t ∼ ( , )ε σ iid olduğundan, 20 ty iid∼ ( , )σ olmasını gerektireceğinden ty serisi beyaz gürültü olarak adlandırılır (Dickey, 2005, s.2). 1φ = 1 olduğu durumda, 1t t ty y ε−= + olacaktır. Bu model ise pür rassal yürüyüş olarak adlandırılır. Bu modelde herhangi bir dönemdeki rassal şok, zaman içerisinde kaybolmadan diğer dönemleri de etkiler. Bu durum şu şekilde gösterilebilir. 1t t ty y ε−= + ise, 1 0 1y y ε= + 7 2 1 2y y ε= + olduğundan, 2 0 1 2y y ε ε= + + 3 2 3y y ε= + olacağından, 3 0 1 2 3y y ε ε ε= + + + ve genel bir ifade olarak, 0 1 t t t i y y ε = = +∑ yazılabilir. Özet olarak, ty serisinin zaman içerisindeki değerleri, başlangıç değeri olan 0y ve rassal terimin o ana kadarki tüm değerlerinin toplamından oluşmaktadır. Bu durumda rassal yürüyüş modeli sonsuz bir belleğe sahip olup, rassal şokların etkisi altında ve ne yönde hareket edeceği önceden tahmin edilemeyen bir yapıdır (Patterson, 2000, s.210). Bu yapıya bir ekleme 1φ = 1 olan AR(1) yapısına sabit bir terim (µ ) konularak yapılabilir. Böylece, 1t t ty yµ ε−= + + olacaktır. Burada, µ yığılma terimi adını alır. Yığılma teriminin burada önemi tε ’deki rassal gerçekleşme ne olursa olsun µ ’den dolayı ty serisinin yukarı hareket edeceğidir. Şöyle ki, 1 0 1y yµ ε= + + 8 2 0 1 22y yµ ε ε= + + + 3 0 1 2 33y yµ ε ε ε= + + + + ve genel bir ifade kullanarak, 0 1 t t t i y y tµ ε = = + +∑ bu modele kayan rassal yürüyüş modeli adı verilip, birinci farkı alındığında, 1t t ty y µ ε−− = + yada, t ty µ ε∆ = + elde edilir. Bu modelin özelliği, 20( , )t εε σ∼ iid olduğundan, birinci fark serisi µ ortalamaya sahip olan , pür rassal yürüyüş modeli olmasıdır (McCabe / Tremayne, 1995, s.1016). Zaman serisi analizi açısından ise bir örnek yardımıyla şu açıklamanın getirilmesi yerinde olacaktır. tA = 0,4t + tε şeklindeki deterministik trende sahip olan seri ile, 10 4,t t tB B ε−= + + şeklinde stokastik trende sahip olan serinin aralarındaki fark bir takım testler yapılmadan anlaşılamaz. Ancak burada tA serisi deterministik trend dışında belirli bir ortalama etrafında dalgalanırken, tB serisi belirli bir ortalamaya dönme kuvvetinden yoksun bir seridir (Franses, 1998, s.71). Çünkü, tA serisi deterministik trend ve durağan bileşenden oluşmuşken, tB serisi stokastik trend ve durağan bileşenden oluşmuştur (Hatanaka, 1996, s.16). Aşağıda şekil 1 (a) ve (b)’de sırasıyla tA ve tB serileri görülmektedir. İki seri birbirlerinden açık bir fark ortaya koymamaktadır. 9 (a) (b) Şekil 1: Deterministik ve Stokastik Trende Sahip İki Seri Böylece buraya kadar sıralanan özelliklere sahip genel bir bir zaman serisi modeli, 1 1t t ty y tµ φ β ε−= + + + şeklinde ifade edilebilir. Buradan hareketle aşağıdaki 5 ayrı model söz konusudur (Patterson, 2000, s.226). Model Parametreler Açıklama Özellik 1 10 1 0, ,µ φ β≠ < ≠ Deterministik trend ve I(0) durağan AR(1) bileşeni 2 10 1 0, ,µ φ β≠ = ≠ Kayan Rassal yürüyüş ve I(1) deterministik trend 3 10 1 0, ,µ φ β≠ = = Kayan rassal yürüyüş I(1) 4 10 0 0, ,µ φ β≠ = ≠ Deterministik trend I(0) 5 10 1 0, ,µ φ β= = = Pür rassal yürüyüş I(1) 10 1. Gecikme Yapısının Belirlenmesi Yukarıda ifade edilen modeller sadece birinci dereceden bir AR(1) yapısını açıklamak için kullanılmaktadır. Aslında daha gerçekçi bir yaklaşım ek bazı otoregresif ve hareketli ortalama bağımlılığın seride yer alabileceğidir (Stock / Watson, 1986, s.148). Çünkü p. dereceden bir otoregresif yapı düşünülecek olursa, 1 1 2 2 .....t t t p t p tY y y yφ φ φ ε− − −= + + + + bu durumda AR(1) süreci ile ele alınan süreçte 1 1t tY yφ −= tε+ hata terimi, temiz bir seri değil, aşağıda gösterildiği gibi serisel olarak korelasyonlu olur tε = 2 2 3 3 ............t t p t py y yφ φ φ− − −+ + + tv+ Bu nedenle kalıntılardaki serisel korelasyonun ortadan kaldırılması gereklidir. Bu amaçla kullanılabilecek başlıca iki temel yaklaşım bulunmaktadır. Bunlardan birincisi teorik bilgi kriterlerinden yararlanmak, ikicisi ise genelden özele ya da özelden genele modelleme stratejisini kullanmaktır. - Teorik Bilgi Kriterlerinin Kullanımı ile gecikme yapısının derecesi belirlenirken cimrilik prensibi dikkate alınarak, bir ceza fonksiyonu yardımıyla fonksiyonel gecikmelerin sayısı mümkün olduğunca minimize edilir. Pratik olarak, daha sonra sunulacak olan Akaike (AIC) ve Schwarz (SIC) bilgi kriterlerinden elde edilen değerlerin marjinal anlamlılık düzeyleri kullanılarak kalıntılarda serisel korelasyonun olup olmadığı test edilebilir (Gonzalo / Pitaraki, 2005, s.401). 11 - Genelden Özele ve Özelden Genele Modelleme Stratejilerinin kullanımında ise sırasıyla genelden özele stratejisinde, birisi m gecikmeli ve diğeri m+n gecikmeli iki modelden son n gecikmenin bileşik olarak sıfıra eşit olduğu boş hipotezi Wald testi yardımıyla sınanır. Özelden genele stratejisinde ise, gecikme uzunluğunun belirlenmesinde n=1 alınarak ve birer birer artırılarak t testi yardımıyla modele dahil edilen son gecikmenin anlamlılığı test edilir (Sevüktekin ve Nargeleçekenler, 2007, s.325).. Diğer taraftan genelden özele yaklaşımı, özelden genele yaklaşımına göre daha çok tercih edilir. 2. Dickey-Fuller ve Genişletilmiş Dickey-Fuller Testleri Said ve Dickey (1984), daha önce Dickey ve Fuller (1979) tarafından ileri sürülen ve sadece AR(1) yapısında birim kökü test eden testi (DF testi) daha yüksek dereceden AR ve MA yapılarında da çalışabilecek şekilde genişletmişlerdir (ADF testi). DF testi için, 1 1t t ty yφ ε−= + şeklindeki AR (1) modelini ele alalım. Eşitliğin her iki tarafının da farkı alındığında model, ttttt yyyy εφ +−=− −−− 1111 ttt yy εφ +−=∆ −11 )1( 1 t t ty yγ ε−∆ = + şeklini alacaktır. Öte yandan burada, 12 11 −= φγ ve 1−−=∆ ttt yyy dir. Ele alınan modelde stokastik trendin varlığının test edilmesi aslında boş hipotez olarak otoregresif parametrenin 1’e eşit olmasının test edilmesine eşittir ve alternatif hipotezinde 1’den küçük olarak oluşturulması serinin trend durağan olduğunu belirtir (Phillips ve Xiao, 1998, s.3). Bu durumda, DF testinde, boş ve alternatif hipotezler şu şekildedir. )10: )10: 1 0 << == 1 1 ( H ( H φγ φγ Birim kök testi yapılırken, ele alınan bu model en küçük kareler yöntemiyle tahmin edilir ve γ̂ parametresinin 1’e eşit olup olmadığı, t testi mantığında test edilir. Buna τ̂ -test istatistiği de denilir. 1φ sıfıra ne kadar yakın ise serinin o kadar çabuk durağanlaşacağı açıktır. Ayrıca, burada alternatif hipotezin tek yanlı kurulmasının nedeni ise testin gücünü mümkün olabildiğince arttırmaktır. Tahmin edilen γ̂ parametresi için t istatistiği mantığında hesaplanan τ̂ -test istatistiğinin karşılaştırılacağı kritik değerler ise τ̂ istatistiği, student t dağılımına göre negatif değerlere doğru çarpıklık gösterdiği için DF testi kritik değer tablosundan alınan değerle karşılaştırılır (Redebusch, 1992, s.664). Fakat, seride bir sabit terim yada deterministik trend varsa bu durumda bunların da regresyona eklenerek testin yapılması gerekmektedir. Böylece, bu durumda sırasıyla kesme eklenmiş modelde µτ̂ ve deterministik trend eklenmiş modelde ise βτ̂ test istatistikleri kullanılacaktır. Daha önce gecikme uzunluğunun belirlenmesi konusunda belirtildiği gibi, yüksek mertebeden bir ARMA yapısıyla çalışılıyorsa test istatistiğini hesaplamak için tahmin edilen regresyon denkleminin hata terimlerinde otokorelasyon olacaktır. Bu sorunun giderilmesi amacıyla Said ve Dickey (1984) Genişletilmiş Dickey Fuller testini geliştirmişlerdir. Uygun gecikme yapısının belirlenmesinden sonra tahmin edilmesi gereken denklem, t p j jtjtt YYtY εαγβµ +∆+++=∆ ∑ = −− 1 1 13 şeklindedir. ADF testi, DF testinde kullanılan modele göre p adet fazla regresör içerir (Serletis, 1992, s.393). Denklem tahmin edildikten sonra γ parametresinin t değeri mantığında hesaplanan test istatistiği kritik değerlerle karşılaştırılır. ADF testi sol taraflı bir test olduğundan dolayı, eğer test istatistiği kritik değerden küçük ise birim kök hipotezi red edilmiş olacaktır. C. MEVSİMSELLİK Ekonomik zaman serileri üzerine mevsimsellik ile ilgili olarak ilk çalışma James W. Gilbart tarafından 1854 yılında yapılmıştır. Bir banker olan Gilbart İngiltere Bankası banknotlarına olan talebin Ocak, Nisan, Temmuz ve Ekim aylarında oldukça yüksek olduğunu bulmuştur. Öte yandan zaman serlerinde periyodik hareketliliği ilk açıklayan kişi ise bir astronom olan Herscheldir. Herschel 1801 yılında güneş tutulmaları ile buğday fiyatları arasındaki ilişkiyi bulmuştur (Hylleberg, 1992, s.15). Devreler bir yıldan uzun olmamak şartıyla bir zaman serisindeki tekrarlanan döngüsel hareketlerin tümüne mevsimsel dalgalanma adı verilir (Serper,2004,s.398). Zaman serisi analizinde mevsimselliği düzeltilmiş serileri kullanmak oldukça sık başvurulan bir yöntemdir. Mevsimselliğin düzeltilmesi konusunda kullanılan filtre temelli yaklaşımlar X-11 tipi metotlar olarak adlandırılır. Bu prosedür başlıca 3 temel adım içerir. Birinci adımda, hareketli ortalama ile trend tahmin edilir. İkinci adımda, tahmin edilen trend seriden alınır. Üçüncü adımda, trendden arındırılmış seriden mevsimsel bileşen hareketli ortalama yöntemi ile alınır. Burada önemli olan nokta, seriden trendin tam olarak arındırılmadığı durumda mevsimsel bileşenin tam olarak bilinemeyeceğidir. Ancak diğer taraftan mevsimsel bileşenden arındırılmamış bir seride trend de tam olarak tanımlanamaz. Bu nedenle, X-11 yöntemi iteratif bir süreç olarak uygulanır (Kenny / Durbin, 1982, s.76). 14 Ancak bazı durumlarda, serilerden mevsimsel düzeltme ile dışlanan bilgi, politika geliştirmede ve geliştirilen politikaların uygulanmasının zamanlamasında oldukça önemli olabilir. Bu nedenle de mevsimsel örüntünün seriden alınmaması gerekebilir. Bu durumda, ARIMA modelleme stratejisinin bir uzantısı olan mevsimsel modelleme yöntemi SARIMA modelleri modelleme aracı olarak önerilmektedir. Öte yandan SARIMA modellerinin, kullanılan örneklemi k gecikme uzunluğunda kısaltmasından dolayı bir alternatif yöntem olan Periyodik Modeller ön plana çıkmaktadır (Franses, 1998, s.118). Ayrıca Tiao ve Grupe (1980), Franses (1996), Boswijk, Franses ve Haldrup (1997) ve (Osborn1988) periyodik modellerin öngörü performanslarının peryodik olmayan modellerden daha üstün olduğunu belirtmektedirler. Bu nedenlerle bu başlık altında periyodik modellerin kullanımı tartışılacaktır. 1. Periyodik Otoregresif Model Periyodik otoregresif model (PEAR), AR modelinin otoregresif parametresinin zaman içerisinde mevsimler boyunca dinamikleştirilmesine dayanır. Böylece, örneğin çeyrek yıllık veri seti ile çalışıldığı durumda, her bir çeyreğin diğerlerine göre göreceli etkisi ayrıştırılabilir (Kurozimi, 2002, s.243). Aslında bu yöntem ekonomik birimlerin farklı mevsimlerde farklı davranış kalıpları göstermelerinden dolayı oldukça kullanışlı bir yoldur. PEAR (p) modeli, , 1, 1 , ,.........s t s s t p s t p s tY Y Yµ φ φ ε− −= + + + + şeklindedir. Çeyrek yıllık veri seti ile çalışıldığı durumda (s=4) ve gecikme uzunluğu 1 alındığında (p=1), yukarıdaki model açık olarak, 15 4, 4 1,4 3, 4, 3, 3 1,3 2, 3, 2, 2 1,2 1, 2, 1, 1 1,1 4, 1 1, t t t t t t t t t t t t Y Y Y Y Y Y Y Y µ φ ε µ φ ε µ φ ε µ φ ε− = + + = + + = + + = + + şeklini alacaktır. Görüldüğü gibi periyodik modelde birinci dereceden bir AR yapısını açıklamak için dört otoregresif parametre kullanılmaktadır. Bu şekilde bir modelleme için seçilebilecek iki farklı yol vardır. Bunlardan birincisi, periyodik olmayan model tahmininden elde edilen kalıntılar üzerinden periyodik varyasyonun varlığını sınayan bir takım testlere başvurmaktır. İkincisi ise, PEAR (p) modelinde p yapısını model seçim kriterlerine göre belirledikten sonra tahmin edip, otoregresif parametrelerde periyodik varyasyonun varlığının bir takım testlerle sınanmasıdır (Franses, 1998, s. 120). Bu çalışmada uygulama aşamasında ikinci yol kullanıldığından dolayı burada da ikinci yolun ayrıntıları sunulmuştur. İlk olarak karar verilmesi gereken nokta kaçıncı dereceden bir model kullanılacağıdır. Bu amaçla daha önce değinildiği gibi AIC ve SIC kriterleri kullanılabilir. Otoregresif yapı doğru olarak belirlendikten sonra ikinci olarak, modelin tahmini yapılacaktır. Bu amaçla aşağıdaki modelde doğru otoregresif yapı ele alındığı varsayımıyla, 1, 1 , ,.........t s s t p s t p s tY Y Yµ φ φ ε− −= + + + + ve ,s tε ’nin normalliği varsayımı altında en çok olabilirlik tahmini ve olağan en küçük kareler tahmincilerinin birbirlerine eş değer olacağından en küçük kareler yöntemi ile model tahmin edilebilir. Üçüncü aşama ise otoregresif parametrelerde periyodik varyasyonun testidir. Boswijk ve Franses (1996), aşağıdaki hipotez çiftini test eden ve F(3p, n- (s+sp)) dağılımına sahip olan bir F testi önermektedirler. 16 1 0 1[( ) / ] /[( ) / ]F n l s RSS RSS RSS= − − şeklindeki bu testte RSS1 ve RSS0 sırasıyla kısıtsız ve kısıtlı modellerin kalıntı kareler toplamları olmak üzere ve n örneklem sayısı, l’de bir yıldaki dönem sayısını belirtmek üzere, 0 , 1 1, : : p s i p s i H H φ φ φ φ+ = ≠ hipotezi sınanır. Testin değeri 3p ve n-(s+sp) serbestlik dereceli tablo değerini aşarsa otoregresif parametrelerde periyodik varyasyonun varlığı kabul edilir. Böylece, otoregresif parametrelerde periyodik varyasyonun varlığının kabulü ile, son aşama olan birim kök testi aşamasına başlanabilir. 2. Periyodik Otoregresif Modelde Birim Kök Testi Mevsimsel etkinin büyük ölçüde deterministik yapı içerdiği düşünülse de aslında takvim ve hava koşullarına bağlı değişimler bir süre sonra ekonomik birimlerin kendi fayda fonksiyonlarının ve alışkanlıklarının değişmesini, sabitlenmemesini beraberinde getirir. Bu gibi nedenlerle, mevsimsellik stokastik bir yapıda gösterebilir (Ashworth ve Thomas, 1999, s.736). Bir PEAR (1) süreci, , 1, ,s t s s t s tY Yα ε−= + s=1,2,3,4 ve t=1,2,3,…. şeklinde ifade edilsin. Ayrıca burada, 2 , (0, )s t Nε σ∼ dir. Burada durağanlık koşulu 1α 2α 3α 4α çarpımına bağlıdır. Eğer süreç durağan ise, 1 2 3 4 1α α α α < , eğer periyodik olarak entegre ise, 1α 2α 3α 4α = 1 olacaktır (Castro ve Osborn, 2005, s.7). Böylece boş hipotez ve alternatif hipotezler, 17 H0 : 1α 2α 3α 4α = 1 H1 : 1α 2α 3α 4α ≠ 1 şeklinde olacaktır. Boş hipotezin getirdiği kısıt altındaki regresyon, 1 1 1, 1 2 2, 1 3 3, 3 1 2 3 4,( )t t t t t t t t tY D Y D Y D Y Dα α α α α α ε− − − −= + + + + şeklindedir. Burada D mevsimsel kukla değişkenleri temsil etmektedir. Bu model doğrusal dışı en küçük kareler yöntemi ile tahmin edilebilir. Bu modelin kalıntı kareler toplamı RSS0 ve kısıtsız genel modelin kalıntı kareler toplamı ise RSS1 olmak üzere, Boswijk ve Franses (1996)’nın önerdiği en çok olabilirlik oranı testi, LR = n log (RSS0 / RSS1) şeklinde olup, 4 serbestlik dereceli bir 2χ dağılımına uyar. D. YAPISAL KIRILMA Perron (1989)’a göre ekonomide bazı kriz ve benzeri dönemler serilerin ortalamaları üzerinde kalıcı etkiler bırakabilmektedir. Bu durumda problem serinin durağanlığının ADF tipi testlerle test edilememesidir. Çünkü böyle bir durumda, şekil 2’de de gösterildiği gibi seride kırılmanın ortaya çıktığı dönem öncesinde küçük değerler(büyük değerler) yine küçük değerler(büyük değerler) tarafından izlenirken kırılma sonrasında göreceli büyük değerler (küçük değerler) yine göreceli büyük değerler (küçük değerler) tarafından izlenir. 18 Şekil 2: Yapısal Kırılmalı Bir Seri Böylece yt-1’in otoregresif katsayısının 1’e eşitliğini test eden birim kök testleri birim kökü red etmeme yönünde yanlı olurlar. Aslında kırılmanın olduğu dönem öncesinin ve sonrasının ayrı ayrı test edilmesi bir çözüm olarak görülse de bu durumun serbestlik derecesinde ortaya çıkaracağı azalma nedeniyle ilgi görmemektedir (Enders, 2004, s.202). Ayrıca bir çok durumda kırılmanın yeri de tam olarak bilinmediğinden seride kırılma dönemini tespit etmek için, Bai (1997), Bai ve Peron (1998), Zivot ve Andrew (1992), Vogelsang (1997), Lumsdaine ve Papell (1997) tarafından geliştirilmiş ayrı ayrı testler bulunmaktadır. Bu çalışmanın uygulama bölümünde, literatürde yaygın olarak kabul görmüş olan Vogelsang ve Perron (1998) yaklaşımı kullanılmıştır. TB kırılma olan dönemi ve T toplam gözlem sayısı olmak üzere seride ani bir kırılma olduğunu düşünelim. Bu tip bir durum “eklenebilir aşırılık” (Additive outlier (AO)) durumu olarak bilinmektedir. (Öte yandan bu kırılma seride zaman içerisinde daha yumuşak bir şekilde ortaya çıkıyorsa bu tip bir duruma verilen ad ise “yenilikçi aşırılık” (innovational outlier)). AO durumunda olası üç ayrı model söz konusudur. Bunlar, t t tY t DU uµ β θ= + + + (Model 1) t t t tY t DU DT uµ β θ γ= + + + + (Model 2) t t tY t DT uµ β γ= + + + (Model 3) 19 Burada, B B 0 t T ise 1 t T 1 isetDU ≤ =  ≥ + ve B B 0 t T ise 1 t T 1 isetDT ≤ =  ≥ + şeklindedir. Birinci model sadece düzeyde bir kırılma içerir, ikinci model hem kesme hem de eğimde bir kayma içerir, üçüncü model ise sadece eğimde kayma içerir. Öte yandan bu üç modelde de hata yapısı durağan bir süreç olarak varsayılmaktadır. Hata teriminin durağan olduğu alternatif hipotezi altında yt kırılmalı trend etrafında durağandır. Birim kök boş hipotezi altında ise, yt I(1)’dir. Bu durumda fark serisi ty∆ , durağan bir süreçtir ve, t t tY D vβ θ∆ = + + t t t tY D DU vβ θ γ∆ = + + + t t tY DU vβ γ∆ = + + eklindedir. Burada ayrıca, B B 0 eğer t T 1 1 eğer t=T 1tD ≠ + =  + olup, hata terimi vt , durağandır. Bu şekilde birim kökü test etme prosedürü başlıca iki adımda gerçekleştirilir. Birinci adımda yukarıdaki modellerden bir tanesi trendden 20 ayrıştırılarak kalıntılar ( tY� ) elde edilir, İkinci adımda ise bu kalıntılara dayalı aşağıdaki regresyonlar tahmin edilir, 1 0 0 k k t t i t i i t i t i i Y y w D c yα ε− − − = = = + + ∆ +∑ ∑� � � (1. ve 2. model için) 1 0 k t t i t i t i Y y c yα ε− − = = + ∆ +∑� � � (3. model için) ve α =1 hipotezi test edilir. Burada karşılaşılabilecek problem daha önce de belirtildiği gibi kukla değişkenlerin oluşturulmasında kullanılan kırılmanın döneminin tespitidir. Eğer kırılma dönemi biliniyorsa, α =1 hipotezinin testinde kullanılan test istatistiği Peron (1989) ya da Peron ve Vogelsang (1993)’de önerilen kritik değerlerle karşılaştırılabilir. Burada, BT T λ = nisbi kırılma yansımasıdır ve kritik tablo değerinin belirlenmesinde de rol oynar (Sevüktekin / Nargeleçekenler, 2007, s.407). TB’nin bilinmediği durumda ise Vogelsang ve Peron (1998) şu prosedürü önermektedirler. Kırılma dönemi bilinmediği için, BT T λ = olmak üzere ve toplam gözlem sayısının ilk ve son %15’lik kısmı dışlanarak elde kalan gözlemler üzerinden, TB=1,2,3,…….,T şeklinde ayrı ayrı regresyon tahminleri yapılır. , = 0 ve t = 0t deθ γθ γ′ hipotezlerini test eden istatistikler olmak üzere, - Birinci modelde eğer 0θ > ise maksimum tθ ’yi veren, ya da , 0θ < ise minimum tθ ’yı veren dönemin kırılma dönemi olduğu kabul edilir. - İkinci modelde eğer 0γ > ise maksimum tγ ’yi veren, ya da, 0γ < ise 21 minimum tγ ’yı veren dönemin kırılma dönemi olduğu kabul edilir - Üçüncü modelde eğer 0γ > ise maksimum tγ ’yi veren, ya da, 0γ < ise minimum tγ ’yı veren dönemin kırılma dönemi olduğu kabul edilir. Vogelsang ve Peron bu prosedürün kullanımıyla doğru kırılma döneminin seçilebileceğini asimptotik olarak göstermişlerdir. Bu nedenle de, yine Peron (1989) yada Peron ve Vogelsang (1992)’de verili kritik değerler kullanılabilir. E. VOLATİLİTE MODELLEMESİ Engle (1982) zaman serisi modellemesinde hata teriminin sabit varyanslı olma varsayımının geçerli olmayabileceğini İngiltere’ye ait enflasyon serisini inceleyerek ortaya koymuştur. Aslında, alışılagelmiş olarak niteleyebileceğimiz yaklaşımda zaman serilerindeki temel problem otokorelasyon olarak düşünülmekte ve değişen varyans problemi yatay kesit verileriyle çalışıldığında karşılaşılabilecek bir problem olarak görülmekteydi (Greene, 1997, s.569). Bu nedenle de ele alınan zaman serisi sabit varyansa sahip olmadığı durumda bildik yöntemler modellemede ve öngörü yapmada başarılı olamamaktadır. Otoregresif koşullu değişen varyans (ARCH) modelleri ise varyansa öngörü hatalarının karelerinin bir fonksiyonu olarak değişim serbestliği getirmektedir. Aşağıdaki AR (1) modeli ele alındığında, 0 1 1t t ty a yφ ε−= + + 2(0, )t N εε σ∼ olmak üzere, ty ’nin koşulsuz ortalaması sıfır ve koşullu ortalaması ise 1 1tyφ − iken, koşullu varyansı 2 εσ ve koşulsuz varyansı da 2 2 11 σ φ− şeklindedir. 22 (Engle, 1982, s.987). φ 1’ in alabileceği değerler 0< φ 1 < 1 olduğundan dolayı koşullu varyans koşulsuz varyanstan daha küçük değer almaktadır. 1. ARCH MODELİ Yukarıda AR(1) modelinde sözü edilen öngörü 1ty + ’in koşullu varyansı, [ ] 2 1 1 1( )t t t tVar y y E y yφ+ += − = 2 1( )tE ε + şeklindedir. Sabit varyans varsayımının geçersiz olduğu durumda, koşullu varyansın bir AR(q) modeli ile tahmini basit bir şekilde yapılabilir (Enders, 2004, s114). Bu yaklaşım, 2 2 2 2 0 1 1 2 2 ˆ ˆ ˆ ˆ.........t t t q t q tvε α α ε α ε α ε− − −= + + + + + şeklinde gerçekleştirilebilir. Burada vt beyaz gürültü sürecidir. Langrange çarpanları testi yardımıyla yukarıdaki tahmin sürecinin bir AR(q) modeli olarak ele alınması durumunda ARCH etkisinin varlığı test edilebilir. LM = (T-q) R2 şeklinde hesaplanan test istatistiği q serbestlik dereceli bir 2χ dağılımına sahiptir. Bu durumda, 0 1 2 1 1 2 : ..... 0 : ..... 0 q q H H α α α α α α = = = = ≠ ≠ ≠ ≠ şeklindeki hipotez takımı test edilerek LM < 2 qχ tablo durumunda H0 red edilerek ARCH etkisinin varlığına ve model spesifikasyonunun uygun olduğuna karar verilebilir. Böylece tüm hata gecikmelerinin katsayıları sıfıra eşittir boş hipotezi red edilemediği durumda tahmin edilen varyans 0α ’a eşit olur. Bunun anlamı 23 sabit varyans varsayımının geçerliliğidir. Diğer taraftan en az bir hata gecikmesinin katsayısı anlamlı derecede sıfırdan farklı ise örneğin 1α , bu durumda 1 1t tx yφ −= olmak üzere, ARCH (1) modeli, 1 2 0 1 1 ( , )t t t t t t t t t y Y x b h h y x b α α ε ε − − = = + = − şeklinde olacaktır. Böylece varyans en çok olabilirlik prosedürü yoluyla elde edilir (Poon / Granger, 2003, s.484). Bu modelde, 0 10 ve 0 < < 1α α> kısıtları vardır. Bu ikinci kısıtlama sürecin kararlılığının sağlanması için yada diğer bir ifade ile sonsuz bir varyansa sahip olmaması için gereklidir (Işığıçok, 1999, s.4). 2. GARCH MODELİ Bollerslev (1986) Engle’ın yaklaşımını genişleterek koşullu varyansın ARMA yapısında da olduğu durumda tahminine olanak sağlamıştır. Böylece ARCH modellerine göre daha etkin geçmiş bilgiye sahip ve daha esnek bir gecikme yapısında olan bu model Genelleştirilmiş Otoregresif Koşullu değişen Varyans modeli (GARCH) adını almıştır. Bu durumda hata yapısı, t t tv hε = şeklinde ele alınarak ve 2 1vσ = olmak üzere, tε ’nin beklenen değeri, E( tε ) = E( 1 2, ( )t tv h = 0 şeklindedir. Koşullu ve koşulsuz ortalamaların sıfıra eşit olduğu bu model yapısı, 24 1 0 1 1 1 (0, )t t t p q t t i j t j t i j t t t y h h h v y x b ψ α α ε β ε − − − = = ≈ = + + + = − ∑ ∑ formundadır. Bu modeldeki kısıtlar, p 0 i j i i=1 1 0, 0, 0 ve 1 q j j α α β α β = > ≥ ≥ + <∑ ∑ şeklindedir. Öte yandan son kısıt zayıf durağanlığı işaret eder (Cao ve Tsay, 1992, s.167). GARCH yapısının varlığı yine ARCH yapısının teşhisi gibi aynı mantıktaki LM testi ile test edilebilir. Ancak bu durumda hipotez takımı biraz daha karmaşık hal alır (Sevüktekin / Nargeleçekenler, 2006, s.253). 0 1 2 1 2 1 1 2 1 2 : ..... ....... 0 : ..... ....... 0 q p q p H H α α α β β β α α α β β β = = = = = = = = ≠ ≠ ≠ ≠ ≠ ≠ ≠ ≠ LM test istatistiği ise, LM = (T-p-q) R2 şeklinde elde edilir ve (p + q) serbestlik dereceli 2χ dağılımına uyar. GARCH (p,q) modeli q = 0 için ARCH (p) modeline denk olacaktır. Son olarak, bir çok ampirik çalışmaya göre GARCH modeli ARCH modeline göre daha cimri olup, GARCH (1,1) modeli bir çok finansal zaman serisi için en popüler yapıdır (Poon / Granger, 2003, s.484). 25 F. DOĞRUSAL DIŞILIK İktisatta kullanılan istatistiksel ve ekonometrik yöntemler, doğrusallık varsayımı ile aslında iktisat teorisinin bazen arka planda zimni olarak kabul ettiği bazen de direkt vurguladığı doğrusal dışı ilişkileri göz ardı etmektedir. Bu durum gerçek hayata ilişkin fenomenlerin modellemesinde kimi zaman ciddi sınırlamalar yaratmaktadır (Arnold, 2003, s.479). Örneğin, ücretlerin aşağıya doğru gösterdiği yapışkanlık, ekonominin genişleme dönemlerinde işsizlik oranının azalmasındaki yavaşlığa rağmen, daralma dönemlerinde işsizlik oranındaki artışın hızlı olması ya da kısa ve uzun dönemli faiz oranlarındaki farkın bir eşik değere göre farklı hareket etmesi ve benzeri iktisat teorisinden gelen açılımlar, doğrusal modelleme araçlarıyla modelleme yapıldığında göz ardı edilmiş olmaktadır. Ancak iktisadi seriler üzerinde dinamik ayarlanma mekanizmasının çalışması kalıcı etkilerin (persistance machanism) varlığına bağlıdır (Mikhail / Eberwein / Handa, 2003, s.1). Örneğin, Rodriguez (2004), petrol varil fiyatlarındaki doğrusal dışılığın göz ardı edilmesinin, petrol varil fiyatlarındaki dalgalanmaların yakalanamamasına ve buna bağlı olarak da GSMH tahminlerinin doğru olarak elde edilememesine yol açtığını belirtmektedir (Rodriguez, 2004, s.2). Fakat bu göz ardı ediş, bazı durumlarda tam anlamıyla yanlış model kullanmak olarak adlandırılmayabilir. Çünkü doğrusallık şeklindeki tek bir yaklaşıma karşın ortaya konulan tek bir doğrusal dışılık formu yoktur. Dolayısıyla, serinin doğrusal olup olmadığının ya da doğrusal dışı bir karakter sergileyip sergilemediğinin testinde, doğrusallık hipotezinin karşıtı hipotez tek bir doğrusal dışılık formu olmayacaktır. Bu durum da yanlış bir doğrusal dışı model seçmenin maliyeti doğrusal bir model kullanmaktan çok daha yüksek olmaktadır. Bir başka ifade ile, yanlış bir doğrusal dışı model kullanmak, doğru olmadığı bilinen doğrusal bir model kullanmaktan çok daha kötü sonuçlar verecektir. Literatürde son yıllarda yapılan çalışmalara bakıldığında, doğrusal dışı modelleri kurma ve tahmin etmede katlanılan zorluklarının, önraporlama performanslarında sağladıkları (ya da sağlayamadıkları) iyileşme ile telafi edilemeyebildiği de vurgulanmaktadır (Clement, Franses, Swanson, 2003, s.171). Bu nedenle doğrusal dışı modellemeye başvurulacağında, sadece serinin doğrusal dışı olup olmadığının bilinmesi değil, 26 hangi tip bir doğrusal dışılığın olduğunun bilinmesi de son derece önemlidir. Böylece doğrusal dışı modellerden hangisinin kullanılacağının da test edilmesi gerekmektedir. Doğrusal dışılığın doğru tespit edilip, doğru doğrusal dışı modelin kullanılmasıyla en doğru önraporlama değerlerinin elde edileceği açıktır (Kantz / Schreiber, 2003, s.4) . Bu çalışmada kullanılan doğrusal dışı modeller aşağıda genel özellikleriyle tartışılmıştır. Tartışmada yukarıdaki paragraftaki ciddiyetle, bu modellerin sunduğu doğrusal dışılık formu ve bu formun testi ön planda tutulmuştur. Ancak daha sofistike modellere geçmeden önce daha basit iki doğrusal dışı modelin tanıtılması uygun olacaktır. Bu modellerden ilki Genelleştirilmiş Otoregresif Model (GAR) modelidir. Standart AR modelindeki otoregresif gecikmeli değişkenlerin çeşitli kuvetlerini ve bu kuvvetlerin birbirleriyle etkileşimlerini içermektedir.. En basit haliyle bir doğrusal dışı AR modeli, 1 1 1( )t t t tY Y Yφ ε− −= + şeklindedir. NLAR(1) yada GAR(1) şeklinde ifade elden bu model, 1 1 1 1( ) ( )t t tY Y f yφ − − −= olarak ele alınır ve 1( )t t tY f Y ε−= + olarak gösterilir. Modele yöneltilen en temel eleştiri, modelin çok sayıda parametre içerebilmesidir. Eğer iki gecikmeden daha fazla sayıda gecikme modelde ele alınıyorsa bu eleştiri haklıdır denilebilir (Enders, 2004, s391). Bir GAR(2) modeli, 27 2 2 1 1 2 2 3 1 2 4 1 5 2 2 2 6 1 2 7 1 2 t t t t t t t t t t t t Y y y y y y y y y y y φ φ φ φ φ φ φ φ ε − − − − − − − − − − = + + + + + + + + olacaktır. Ancak tüm bunlara rağmen modelin En Küçük Kareler (EKK) yöntemiyle tahmini yapılabileceği ve bazı durumlarda standart AR modellinin ötesinde çözümler üretebilmesi nedeniyle tercih edilebilen bir modeldir (Rothman, 1998, s.167). Modelin geçerliliğinin testi, GAR modelindeki katsayıların ( )iφ geçerliliğinin testidir. Eğer bir katsayı dahi sıfırdan farklı değil ise model geçersiz olacak ve doğrusal AR modeli geçerli model olarak kabul edilecektir. İkinci model ise Bilineer Modeldir (BL). GAR modelinin iki gecikmeden sonrası için çok sayıda parametre içerdiği şeklindeki eleştirilere karşılık olarak, yüksek derecedeki AR yapısına, çok daha cimri ARMA modelleriyle yakınsama sağlanabileceği gerçeğinden hareketle modelde MA terimlerinin AR terimleriyle etkileşimlerine izin verildiği durumda BL modeline ulaşılır. Basit bir BL modeli, 0 1 1 1 1 1t t t t tY y c yφ φ ε ε− − −= + + + şeklindedir. Aynı zamanda, 0 1 1 1 1( )t t t tY c yφ φ ε ε− −= + + + şeklindeki düzenlemeyle, otoregresif katsayı 1 1 1( )tcφ ε −+ olarak yorumlanmalıdır. Bu durumda bu katsayının 0φ ortalamaya sahip rassal bir değişken olduğu mantığıyla ve c1’in pozitif (negatif) olması durumunda ifade 1tε − ile büyür (küçülür). Bu mantık sonuçta pozitif (negatif) şokları, negatif (pozitif) şoklardan daha kalıcı kılacaktır. Öte yandan bu modelin tahmini en çok olabilirlik yöntemiyle yapılabilir1. Modelin geçerliliğinin testi ise basit bir Lagrange çarpanları yöntemiyle elde edilebilir. Yukarıdaki model için, öncelikle bir AR(1) modeli elde edilir. Bu 1 Yt-i t iε − değerleri direkt elde edilemeyeceğinden EKK kullanılamaz. 28 modelin kalıntıları (et), üzerinden aşağıdaki regresyon elde edilerek, 0 1 1 1 1 1t t t t te y c y vα α ε− − −= + + + T örneklem büyüklüğü olmak üzere, TR2 istatistiği hesaplanır. Eğer, TR2 istatistiği, yukarıdaki örnek için, 2 (3)χ değerini aşarsa, Yt serisinin doğrusallığını temsil eden boş hipotez red edilip doğru modelin BL modeli olduğuna karar verilir. 1. Eşik Değer Otoregresif Model (TAR) Yukarıdaki GAR ve BL modelleri doğrusal dışı bir form sunsalar da iktisat teorisinin gerektirdiği bakış açısını tam olarak yansıtamamaktadırlar. Her ne kadar BL modeli pozitif ve negatif şokları ayırabilecek argümana sahip olsa da, istatistiksel modellemenin bu anlamda sunduğu TAR modelleri daha gelişmiş modeller olarak görülmektedir. Ekonominin genişletici (daraltıcı) bir rejimden daraltıcı (genişletici) bir rejime geçişi, ilgilenilen serinin dinamik ayarlama sürecini değiştirecektir. Bu durumda veri yaratma sürecinin TAR modeli olarak ele alınması, otoregresif katsayıya, örneğin 1 0ty − > durumunda 1φ , 1 0ty − ≤ durumunda ise 2φ gibi ayrı değerler alma şansı tanıyan bir sürecin işletilmesini sağlar. Böylece, 1 1 1 t-1 2 1 2 t-1 eğer, y 0 ise eğer, y 0 ise t t t t t y Y y φ ε φ ε − − + > =  + ≤ şeklindeki model elde edilir. AR modelleri grubundan bir model türü olarak kabul edilen TAR modelleri için AR modelleme stratejisindeki model seçim ve tahmin prosedürü uygulanabilir (Fu / Fu / Sun, 2004, s.37). Bu durumda t-1y 0= değeri eşik değer olmak üzere, aslında t-1y 0> durumunda bir doğrusal model ve t-1y 0≤ durumunda bir başka doğrusal model olmak üzere, Yt için tüm model EKK ile 29 tahmin edilebilecek doğrusal dışı bir model olur (Feng / Liu, 2002, s.1-2). TAR modellerinin makro ekonomik serilere uygulamaları Terasvirtave Anderson (1992), ampirik finansta uygulamaları ise Franses (2000) ile başlamıştır (Mizrach, 2006 , s.6). Öte yandan bazı eklemeler ile model geliştirilebilir. İlk olarak iki hata teriminin varyanslarının eşitliği durumunda ( 1 2var( ) var( )t tε ε= ), It gösterge değişkeni olmak üzere model, 1 1 2 1(1 )t t t t t tY I y I yφ φ ε− −= + − + şeklinde yazılabilir. Bu durumda gösterge değişkeni It için, t-1y 0> ise It = 1 ve 1 0ty − ≤ ise It = 0, olacağı açıktır. İkinci olarak, eşik değerin t-1y 0= gibi bilinen bir değer yerine, bilinmeyen bir eşik değer yaklaşımı getirilebilir. Bu durumda veri setinden eşik değerin tahmin edilmesi gerekmektedir. Chan (1993), ele alınan Yt serisinde, %15’lik en düşük ve en yüksek değerin dışlanmasından sonra, elde kalan %70’lik veri setinin her bir değerine potansiyel eşik değer muamelesi yapmayı önermektedir. Böylece eğer 100 gözlemlik bir veri seti ile çalışıyorsak, toplamda 30 gözlemi dışlayıp geri kalan 70 gözlem için 70 ayrı modelden, elde ettiğimiz kalıntı kareler toplamının en küçüğünü veren modelin eşik değeri, kullanılacak eşik değer olarak belirlenir. Üçüncü bir ekleme, dinamik ayarlanma sürecinin t-1y ’den değil de daha önceden başladığını düşünerek yapılabilir. Bu durumda farklı t-dy değerleri kullanarak, dinamik ayarlamanın başladığı uygun gecikmenin en optimal ve kullanışlı tahmini Akaike bilgi kriterine göre belirlenebilir (Fu / Fu / Sun, 2004), s.38). Modele bir başka ekleme, ilk modelde verilen rejim sayısı üzerinden yapılabilir. Örneğin Balke ve Flomby (1997) faiz oranları dönemsel yapısı üzerine 30 yaptıkları çalışmada, iki eşik değer kullanarak üç rejim içeren bir modelle çalışmışlardır. Modele son bir ekleme, Enders ve Granger (1998)’den gelmiştir. Eşik değeri belirlemede t-dy şeklinde düzey yerine, t dy −∆ şeklinde değişimin bir eşiğe göre durumu kullanılabilir. Böylece model, t-d1 eğer, y ise 0 eğer, iset t d I y τ τ− ∆ > =  ∆ ≤ olmak üzere, 1 1 2 1(1 )t t t t t tY I y I yφ φ ε− −= + − + şeklinde oluşturulmaktadır. Bu model eşiğin iki tarafında Yt’nin farklı momentumlara sahip olduğu şeklinde dizayn edildiğinden M-TAR adını alır. Öte yandan Clements ve Smith (2001), ne kadar iyi önraporlama yapıldığının nerede tahmin yapıldığına bağlı olduğunu belirterek, ekonominin genişleme dönemlerinde doğrusal modellerinde iyi önraporlama sonuçları verdiğini, ancak eşik değer modellerinin asıl farkının resesyon dönemlerinde yapılan önraporlamalarda ortaya çıktığını belirtmektedirler (Clements / Smith, 2001, s.137) Tüm bunlara ek olarak, TAR modelleriyle ortaya çıkan en büyük yenilik aslında üzerinde halen çalışmaların yürütüldüğü ancak ana fikrin Balke ve Fomby (1997)’den çıktığı, ve zaman serisi literatürünün gelecek 5-10 yılında bir takım yenilikleri getirecek ve doğrusal dışı analizleri daha fazla içermesine yol açacak, birim kök ve doğrusal dışılığın birlikte ele alınması yaklaşımıdır. Şöyle ki, seriye ilişkin dinamik ayarlanma sürecinin asimetrik olduğu durumda Balke ve Flomby (1997), birim kök testlerinin gücünün düştüğünü göstermiştir. Benzer bir duruma, Caner ve Hansen (1997) çalışmasında ABD işsizlik oranı verisi için yaptıkları çalışmada da rastlanmaktadır. Bu çalışmada Caner ve Hansen, eşik değerin 31 üzerindeki rejim için, işsizlik oranının sabit kaldığını veya arttığını ve gözlemlerin %80’inin bulunduğu bu rejimden dolayı, doğrusal yaklaşımda serinin birim köke sahipmiş gibi göründüğünü belirtmektedirler (Caner / Hansen, 1997, s.22). Aslında veri yaratma süreci TAR modeli olarak ele alındığında ise seri durağandır. Sonuçta, TAR ve M-TAR modelleri hem iktisat teorisinden gelen açılımları yakalamada hem de birim kök süreci için getirdikleri yeni bakış açısıyla doğrusal dışı modellemenin önemli bir aracıdır. Bu modellerin kullanımında, hem sundukları doğrusal dışı formun testi hem de birim kök prosedürünün işletilmesi için Enders (2004) aşağıdaki adımsal prosedürü sunmaktadır. 1.Adım: Eşik değer biliniyorsa klasik yaklaşımla, bilinmiyorsa Chan(1993) yaklaşımıyla TAR modeli kurulur. 2. Adım: Yine eşik değerin bilindiği ya da bilinmediği durum göz önünde tutularak M-TAR modeli elde edilir. 1. ve 2. adımda elde edilen bu iki modelin Akaike bilgi kriterine göre seçimi yapılır. 3. Adım : Seçilen model üzerinden, 1 1 2 1(1 )t t t t t tY I y I yρ ρ ε− −∆ = + − + t-d1 eğer, y 0 eğer, t t d I y τ τ− > =  ≤ yada 1 1 2 1(1 )t t t t t tY I y I yρ ρ ε− −= + − + t-d1 eğer, y 0 eğer, t t d I y τ τ− ∆ > =  ∆ ≤ 1 2 0ρ ρ= = boş hipotezi F testi kullanılarak test edilir. Ancak burada F 32 testinin dağılımı, gözlem sayısı ve kullanılan gecikmeli değerlerden dolayı bozulacağından klasik F tablosu değil Enders ve Grenger (1998) veya Enders ve Siklos (2001)’de verilen F tablosu kullanılarak yapılmalıdır (Wei / Su, 2007, s.5). 4. Adım : Eğer birim kök olmadığı sonucuna varılır ise, dinamik ayarlanma sürecinin simetrik olup olmadığı testine geçilebilir. Bu durumda standart F testi ile sınanacak boş hipotez, 1 2ρ ρ= şeklindedir. Öte yandan Hansen (1997) bu sınama için hata terimlerinin varyansları üzerinden yapılacak F testinin dağılımının bozulduğunu çünkü, 1 2veρ ρ ’nin EKK tahmincilerinin yakınsama özellikleri küçük örneklemlerde zayıf olduğunu belirtmektedir (Hansen, 1997, s.5). 5. Adım: Bu son adımda kabul edilen modelin kalıntıları kontrol edilmeli ve serisel korelasyon araştırılmalıdır. 2. Düzgün Geçiş Modelleri (STAR) TAR modelinin iktisat teorisince vurgulanan rejim değişikliklerini yakalamadaki başarısına karşın, bu rejim değişikliklerini hızlı ya da başka bir ifade ile keskin bir şekilde olduğunu varsayması eleştirilebilir. Bu nedenle bazı durumlarda, istatistiksel modellemenin sunduğu STAR modelleri ailesi kullanışlı bir araçtır. STAR modelleri, rejim geçişlerinin daha yumuşak bir şekilde gerçekleşmesine izin veren modellerdir. Bu nedenle daha sofistike bir modelleme aracı olarak görülürler. TAR modellerinin STAR modellerinin özel bir durumu olduğu rahatlıkla söylenebilir. STAR modelleri iki rejim arasındaki geçişe kullandıkları geçiş fonksiyonuyla bir yumuşaklık kazandırırlar. Bu amaçla kullanılan iki geçiş fonksiyonu bulunmaktadır. Bu fonksiyonlar lojistik fonksiyon ve üstel fonksiyondur. 33 Bir NLAR modeli aşağıdaki şekilde olsun, 0 1 1 1 1 1( )t t t t tY y y f yφ φ β ε− − −= + + + burada f ( . ) fonksiyonu olarak lojistik fonksiyon kullanıldığında model lojistik STAR yada LSTAR modeli adını alır ve, 0 1 1 0 1 1( )t t t tY y yφ φ θ β β ε− −= + + + + 1 1[1 exp( ( ))]ty cθ γ − −= + − − şeklinde olur. Burada, γ , geçiş oranı ya da düzgünleştirme parametresidir. c ise, bir rejimden diğerine geçişi temsil eden eşik değeridir. Bu yapı hem modelin parametrelerin doğrusal dışılığına, hem de rejim değişikliklerinin olmasına izin verir (Rodriguez, Torra, Felix, 2004,s.3). LSTAR modeli kullandığı geçiş fonksiyonu monotonik olarak artan olduğu için, dengeden küçük ve büyük sapmalara farklı davranış gösterebilme izni vermektedir (Haug/ Siklos, 2006, s.10). Eğer geçiş fonksiyonu olarak üstel fonksiyon kullanılırsa bu durumda, 2 1[1 exp( ( ) )]ty cθ γ −= − − − şeklinde olacaktır. Model bu durumda üstel STAR yada ESTAR adını alır. Geçiş fonksiyonu olarak kullanılan bu iki fonksiyonun alabileceği uç değerlerin 0 ve 1 arasında olduğu açıktır. Bu nedenle bu iki uç değerin 0 ve =1θ θ= durumlarında yt’nin dinamik ayarlanma süreci yukarıdaki örnek için sırasıyla, 0 1 1 0 0 1 1 1( ) ( ) t t t t t t Y y Y y φ φ ε φ β φ β ε − − = + + = + + + + şeklinde olacaktır. Öte yandan 0 1θ< < durumunda ise model Yt-1’in alacağı değerlere göre doğrusal dışı bir ayarlama sürecine sahip olacaktır. Bu süreç LSTAR modelinde asimetrik doğrusal dışı bir ayarlanma süreci iken, ESTAR 34 modelinde ise simetrik bir doğrusal dışı ayarlanma sürecidir (Liew / Baharumshah / Lau, 2002, s.3). ESTAR modelindeki bu simetrik süreç, serinin dönüm noktalarının farklı periyotlarda diğerlerine göre farklı otoregresif azalmalar şeklinde ve Yt-1 = c etrafında gerçekleşir (Enders, 2004, s.401). STAR modelnin bir dezavantajı katsayılar çarpımsal olduğu için model tahmininde EKK yönteminin kullanılamamasıdır. Parametrelerin tahmini doğrusal olmayan EKK ile gerçekleştirilir. Ancak bu iteratif bir süreç olduğundan, ve cγ ’nin başlangıç değerlerinin salınımlarının durduğu durumda sona erdirilir ve diğer parametrelerin tahminleri elde edilmiş olur. Burada, Enders (2004), bir başka dezavantaj olarak, doğrusal olmayan EKK yönteminde tahmin edilen parametreler için normal dağılım varsayımı yapılmamasından dolayı, t testi değerlerinin güvenilirliklerini kaybettiğini belirtmektedir. Son olarak, STAR modellerinin geçerliliğinin doğrusal modellere karşı test edilmesi gerekmektedir. Enders (2004), Terasvirta (1994) tarafından geliştirilen test ile, hem bu modellerin doğrusal modellere karşı, hem de kendi aralarında geçerliliklerini test etmek için aşağıdaki adımsal prosedürü önermektedir. Böylece veri yaratma sürecinin doğrusal dışı olup olmadığının yanında LSTAR yada ESTAR tipi bir doğrusal dışılık olup olmadığı da anlaşılacaktır. 1.Adım : Uygun gecikme uzunluğundaki AR(p) modeli AIC ve SIC yardımıyla belirlenip tahmin edilir. 2.Adım : Birinci adımdaki modelin kalıntıları (et) ve aşağıdaki değişkenler ile şu regresyon elde edilir. 0 1 1 1 1 1 2 2 1 1 1 3 3 1 1 1 ..... ..... ..... ..... t t p t p t t d p t t p t t d p t t d t t d p t t d t e a a y a y b y y b y y c y y c y y d y y d y y ε − − − − − − − − − − − − − − = + + + + + + + + + + + + + 35 T gözlem sayısı olmak üzere yukarıdaki regresyonun TR2 istatistiği elde edilir ve 2χ tablo değeri ile karşılaştırılır. Eğer TR2 istatistiği kritik ki-kare tablo değerini aşıyorsa doğrusallık boş hipotezi red edilir, alternatifi olan düzgün geçiş modelinin geçerli olduğuna karar verilir. 3.Adım : Düzgün geçiş modellerinin doğru olduğu kabul edildikten sonra yapılması gereken, LSTAR yada ESTAR modellerinden hangisinin geçerli model olduğuna karar vermektir. Bu amaçla ikinci adımdaki regresyon üzerinden, H0 : d1 = d2 =…….= dp = 0 boş hipotezi test edilecektir. Eğer bu hipotez red edilirse, geçerli modelin LSTAR modeli olduğuna karar verilir. Eğer bu hipotez red edilemiyorsa geçerli model ESTAR modelidir. Bu son adımdaki test edilecek boş hipotezin elde edilmesi aslında lojistik ve üstel fonksiyonların üçüncü dereceden Taylor serisi açılımlarının ortaya konulmasıyla bulunmuştur. Lojistik fonksiyonda, ( )t dy cγ −− − = mt-d olarak kabul edilirse ve kısmi türev sonucu mt-d =0 olarak alınırsa, 2 2 3 3 1/ 4 0 1/ 8 t d t d t d m m m θ θ θ − − − ∂ = ∂ ∂ = ∂ ∂ = − ∂ elde edilecektir. Aynı şekilde üstel fonksiyonda benzer işlemlerle, 2 2 3 3 0 2 0 t d t d t d m m m θ θ θ − − − ∂ = ∂ ∂ = ∂ ∂ = ∂ 36 olacaktır. Böylece, Taylor serisi açılımıyla, LSTAR modeli için, 3 0 1 1 0 1 1 1 3... ( ) ... ( )t t p t p t p t p t d t d tY y y y y m mα α α β β β π π ε− − − − − −= + + + + + + + + + yazılabilir. Taylor serisi açılımıyla, ESTAR modeli için ise, 2 0 1 1 0 1 1 3... ( ) ... ( )t t p t p t p t p t d tY y y y y mα α α β β β π ε− − − − −= + + + + + + + + yazılabilir. ESTAR modelinde kübik hiçbir terimin bulunmaması, H0 : d1 = d2 =…….= dp = 0 şeklindeki boş hipotezin oluşturulmasını sağlamaktadır. Ancak hemen burada belirtilmelidir ki ilgili modele Taylor serisi açılımı ile yakınsamada çok fazla sayıda parametre gerekebilir, bu tip durumlarda testin güvenilirliği kaybolacaktır(Pena / Rodriguez, 2006, s.6). II. ÖNRAPORLAMA Modern hayatın gösterdiği gelişim karşısında her alanı daha karmaşık hale gelen günlük yaşam, geleceğe bakışın daha güvenilir olmasını ve bu nedenle de geleceğe ait planların ve tahminlerin daha tutarlı bir şekilde yapılmasını gerektirmektedir. Bunun bir parçası olarak da iktisadi serilerin önraporlamaları iktisadi birimlerin politika hedeflerini oluşturmaları için önem arz etmektedir. Bu açıdan doğrusal olmayan modellemenin makro ekonomik teorideki önemi yanında, önraporlama konusunda da bazı avantajları bulunmaktadır (Nakamura, 2005, s.374) Bu başlığa kadar üzerinde durulan modellerin önraporlama performanslarının karşılıklı olarak ortaya konulması da yapay sinir ağlarının 37 iktisadi seriler üzerinde kullanımının hangi durumlarda daha iyi sonuçlar verebileceği sorusuna cevap niteliği taşımaktadır. Böylece yüksek önraporlama yeteneğine sahip modeller olarak tanıtılan yapay sinir ağı modellerinin, günümüzde bazıları klasikleşmiş bazıları daha modern ve karmaşık olan modelleme araçları karşısındaki performansları da değişik zaman serisi özellikleri gösteren seriler üzerinden denenmiş olacaktır. Zaman serisi modelleri önraporlama konusunda bazı önemli avantajlara sahiptir. Öncelikle zaman serileriyle yapılan önraporlamalarda önceden gerçekleşmiş değerler kullanılır. İkinci olarak, önraporlamanın doğruluğunun ölçülmesinde bazı ölçüm yöntemleri mevcuttur. Üçüncü olarak, bir kez model kurulduğunda önraporlama elde etmek için çok fazla çabaya ve zaman harcamaya gerek yoktur. Son olarak da, nokta tahmini ve aralık tahmini şeklinde önraporlama elde edilebilir (Gaynor / Kirkpatrick, 1994, s.6). Aşağıda şekil 28 yardımıyla önraporlama ile ilgili bazı kavramlar sunulmuştur. Şekil 3: Önraporlama ile İlgili Ana Kavramlar - ∞ YİLK YSON 1Y nY Örneklem Y 1Ŷ ˆ nY Örneklem 1 ˆ nY + ˆ NYEx post Ex ante 1N̂Y + ˆ N kY + Önraporlama periyodu 38 Tarihsel Veri Seti: Yilk ve Yson arasındaki gözlemlerden oluşur. Yilk veri toplamaya başlanan ilk tarihe ait veri iken Yson değerinin günümüze ait olması en iyi durumdur. Örneklem Periyodu: Y1 ile Yn arasındaki gözlemleri kapsar. Modelin kurulacağı ve model tahmininin yapılacağı dönemdir. Modelden bu döneme karşılık elde edilecek değerler 1 n ˆ ˆ ve YY olacaktır. Aynı zamanda bu değerler örneklem içi önraporlama değerleridir. Önraporlama Periyodu: Expost ve Exante olmak üzere iki ayrı periyottan oluşmaktadır. Ex post periyot, tarihsel veri setinin kapsadığı dönem içinde yapılan önraporlamadır. Bu dönemden elde edilen ve örneklem içi önraporlamadan elde edilen değerler ile modelin doğruluğu hesaplanabilir. Ex ante periyot ise, elde gerçekleşmiş herhangi bir veri yoktur. Bu nedenle doğrulayıcı bir bilgi elde edilmesi mümkün değildir. Eğer örneklem içi ve ex post periyodun performansı tatmin edici ise, ex post periyottaki gözlemlerin modele dahil edilerek modelin tekrar kurulması ile ex ante periyottaki önraporlama performansının artırılabileceği düşünülmektedir. Çünkü bu son eklenen ex post döneminin, ex ante dönemdeki gözlemler ile korelasyonu yüksektir (DeLurgio, 1998, 210). Önraporlama yapılan modelin önraporlama için uygunluğu, modelin ürettiği önraporlama değerlerinin ( )Ŷ gerçek değerlere (Y) ne kadar yakın olduğuna bağlıdır (Gaynor / Kirkpatrick, 1994, s.6). Bu durumda önraporlama hatasını (e) ile gösterirsek, et = ( )ˆ t tY Y− olacaktır. Her bir döneme ait hata (et ), önraporlama sonucu elde edilmiş değer 39 ( )Ŷ etrafında rassal dalgalanmalar olacaktır ve 1 n t t e = ∑ =0 ‘dır. Bu nedenlede önraporlama performansı için kullanılan ölçütler e yada 2e üzerinden oluşturulurlar. Aşağıda tablo 1’de önraporlama performansının değerlendirilmesinde kullanılan ölçütler sunulmuştur. Tabloda sırası ile MAE (ortalama mutlak hata), MAPE (Mutlak yüzde hata ortalaması), MSE ( Ortalama kare hata), RMSE (kök ortalama kare hata) ve U (Theil’in eşitsizlik katsayısı) ölçütlerinin hesaplandıkları formüller verilmiştir. ÖLÇÜT FORMÜL MAE 1 n t t e n = ∑ MAPE 1 n t t t e Y n = ∑ MSE 2 1 n t t e n = ∑ RMSE 2 1 n t t e n = ∑ U 2 1 2 2 1 1 ˆ[( ) / ] ˆ( / ) ( / ) n t t t n n t t t t Y Y n Y n Y n = = = −∑ ∑ ∑ Tablo 1 : Önraporlama Performans Ölçütleri 40 Eğer bir ya da birkaç tane göreceli büyük hata değeri ile çalışılacak ise, MSE ve RMSE değerleri bu durumda uygun olmayacağından MAE tercih edilir. Eğer tüm hata değerleri benzer büyüklükte ise, MSE yada RMSE tercih edilmelidir. Öte yandan, önraporlama performansları karşılaştırılan modeller, farklı frekanstan ya da farklı büyüklüklere sahip veri setlerinden elde edilmişseler bu durumda MAPE kullanılmalıdır. Theil’in eşitsizlik katsayısının kullanıldığı durumda “0” değeri mükemmel uyumu verecektir ancak bu teoride mümkün bir durum olup, “0.55”’in altındaki U değerine sahip modeller iyi önraporlama veren modeller olarak değerlendirilebilir (Lindberg, 1982, s.369). Önraporlama metodu olarak başlıca iki yol kullanılabilir. Bunlardan birincisi, sadece bir önraporlama değerinin yine sadece bir periyot sonrası için elde edildiği tek adım yöntemidir. Bu metotta, örneğin model Yt değerine kadar gözlemlerden oluşmuş ise, Yt+1 değerinin modelden elde edilmesidir. İkinci metot ise, çoklu adım yöntemidir ve bu durumda yine Yt dönemine kadar gözlemlerden oluşmuş modelden en azından Yt+1 ve Yt+2 değerleri önraporlama olarak elde edilir. Eğer Ex post dönem için önraporlama yapılıyorsa bu durumda iki seçenek vardır. Bunlardan ilki, genelde kısa dönemli önraporlamalar için kullanılan ve Yt+1 değeri elde edildikten sonra Yt+2 değeri için bu bilgiyi kullanan iteratif yöntemdir. İkinci yöntem ise, her bir önraporlama yapılacak dönem için ayrı önraporlama modeli kurulmasını gerektiren bağımsız yöntemdir. Son olarak, zaman serisi modelleriyle önraporlama yapıldığında, izlenecek adımlar sırasıyla, (i) tanımlama, (ii) tahmin, (iii) diagnostik kontrolü, (iv) önraporlama değerlerinin elde edilimesi ve (v) önraporlama performansının ölçülmesi olmalıdır ( Salam / Salam / Feridun, 2006, s.144) 41 İKİNCİ BÖLÜM YAPAY SİNİR AĞLARINA GİRİŞ VE TEMEL MODELLER İnsanoğlu sahip olduğu medeniyeti, alet kullanma becerisi ve öğrenme yeteneğine borçludur. Alet kullanma becerisi günlük hayatın gelişimini sağlayıp pratikte de öğrenileceklerin sayısını arttırırken diğer taraftan öğrenme yeteneği ise, kullanılan aletlerin evrimini şekillendirmiştir. Alet kullanma becerisi, ve öğrenme yeteneği arasında günlük hayat üzerinden ortaya çıkan bu etkileşim geniş bir zaman süreci içerisinde makineleri ortaya çıkarmıştır. Tam da bu noktada bir ironi, insanoğluna insan gibi çalışan bir makine yaratma düşüncesinin her zaman için çekici gelmesidir. Elbetteki alet kullanma becerisinin büyük bir kısmının, öğrenme yeteneğinin tamamının ve de bu ironinin temelinde insan beyni vardır. İnsan beyninin modellenmesi üzerine ilk çalışmalar 19. yüzyılın sonlarında başlamıştır. O zamandan günümüze yapılan çalışmalarda, farklı cümlelerle de olsa iki ana vurgu ön plana çıkmaktadır. Birinci temel vurgu paralel çalışma üzerinedir. Örnek olarak Wiggins ve Looper (1991), bu vurguyu şu şekilde vermektedir: Beyindeki nöronlar temel hesaplama üniteleridir. Bir insan beyni ortalama 100 milyar nöron içermekte ve bu hücreler birbirleriyle bağlantılı olarak paralel çalışmaktadır. Bir nöron ortalama bin başka nöronla bağlantılıdır. İnsan beynindeki nöronlar arasında yaklaşık 10 trilyon bağlantı bulunmaktadır. Temel olarak beynin çalışması da bu sinir ağları tarafından gerçekleştirilmektedir (Wiggens / Looper, 1991, s.4). Bu vurguyla başlayan çalışmalar ikinci olarak dijital bilgisayarlardaki mikroçip sayıları ve bunlar arasında birim zamanda gerçekleşen bağlantı sayısı üzerinden bir tartışma ile hız karşılaştırması yaparlar. İnsan beyninin çalışma prensibi ile ilgili olarak yapılan çalışmalarda ikinci temel vurgu ise, adaptasyon yeteneği ve kendi kendini organize edebilme üzerinedir. Örneğin Werner ve Misra (1996), bu vurguyu şu şekilde yapmaktadır: 42 Günümüzün bilgisayar teknolojisinin ulaştığı seviyede dahi insan beyni bilgisayarlarda bulunması arzulanan birçok özelliğe sahiptir. Özellikle, özet bilgilerden genel bir fikre ulaşabilme, örüntü tanıma, hızlı bir şekilde anı hatırlama, lokal bir arıza halinde bile çalışabilme vb. şeklinde örneklendirilebilecek bu özellikler, insan beyninin modellenmesi ve çalışma prensiplerinin anlaşılması konusunda en önemli motivasyonu oluşturmaktadır (Werner / Misra, 1996, s.286). Bu vurguyu ön planda tutarak başlayan çalışmalar ise alıntıdan da anlaşılacağı gibi, bilgisayarların ulaştığı hıza rağmen insan beyninin sahip olduğu özelliklerin anlamı üzerinde dururlar. Cheng ve Titterington (1994), insan beyni ve bilgisayar arasındaki işlem hızındaki farklılığın aslında bir işlem organizasyonu farklılığı olduğunu, adaptasyon farklılığının ise aslında yeni bilgi ve perspektif keşfetme ve kendini buna adapte edebilme yapısının varlığından ya da bir başka ifadeyle öğrenme yeteneğinden kaynaklandığını belirtmektedir (Cheng / Titterington, 1994a, s.6). Yapay sinir ağlarına giriş amacı taşıyan bu bölümde, yapay sinir ağlarının tarihsel gelişimi, kendisine özgü terminolojisi ve yapay sinir ağlarında temel modeller ele alınacaktır. Böylece üçüncü bölümü oluşturan Çok Katmanlı Algılayıcılar ve Geri Dönüşümlü Ağlar içinde bir alt yapı hazırlanmış olacaktır. Bilindiği gibi istatistiksel modelleme konusu başlıca üç başlıkta ele alınabilir, bunlar sırasıyla yoğunluk tahminleri, sınıflandırma problemleri ve regresyondur (Jordan / Bishop, 1996, s.1). Yoğunluk tahminleri başlığı altında ele alınan analizlere Temel bileşenler analizi, Faktör analizi, Kümeleme analizi, Sınıflandırma problemleri başlığı altında ele alınan analizlere Diskriminant analizi, Lojistik regresyon v.b, örnek olarak verilebilir. Bu çalışmanın konusu makro ekonomik zaman serileri analizinde yapay sinir ağlarının kullanımı olduğundan geniş yapay sinir ağı modelleri ailesinin regresyon tipi kullanımı ele alınacaktır. Bu konunun biraz daha açılması gerekirse, yapay sinir ağı terminolojisi başlığı altında anlatılacağı gibi, parametre tahminlerinin bir başka deyişle nöronlar arası bağlantıların ağırlıklarının belirlenmesi eğitim ya da diğer adıyla öğrenme 43 olarak adlandırılır. Yapay sinir ağları literatüründe öğrenme teriminin anlamı örneklemden alınan bilginin aslında henüz elde olmayan gözlemler için genelleştirilmesidir. Bu nedenle yapay sinir ağları bazen öğrenen makine olarak da adlandırılır (Hammer / Villmann, 2003, s.59). Başlıca üç ana tip öğrenme stratejisi vardır. Bunlar öğretmenli öğrenme, öğretmensiz öğrenme ve destekleyici öğrenme stratejileridir. Öğretmenli öğrenme stratejisinde, girdi vektörü ve karşılığında sistemin oluşturması beklenen çıktı vektörü sisteme verilir. Sistemden beklenen ilgili ağırlık değerlerini bu girdi – çıktı setine göre (bağımlı – bağımsız değişken ilişkisine dayanarak) hesaplayarak, verilen girdiye karşılık doğru çıktıyı üretmesidir. Bu stratejiyi kullanan başlıca yapay sinir ağı modelleri: Çok katmanlı algılayıcılar, Geri dönüşümlü ağlar, Hopfield ağları sayılabilir. Öğretmensiz öğrenme stratejisini kullanan ağlarda ise sisteme sadece girdiler verilir ve ağdan veri kümesinin sahip olduğu dağılımdan çıktıları üretmesi beklenir (Oja, 2002, s.189). Direkt olarak veri setinin gösterdiği dağılım üzerinden kümeleme yapılmaktadır. Bu açıdan, bu öğrenme stratejisini kullanan ağlar, yoğunluk tahmini olarak adlandırılan kümeleme analizi , faktör analizi v.b. analizlere benzerlik gösterirler. Destekleyici öğrenmede ise sisteme yine sadece girdiler verilirken üretmesi beklenen çıktılar sisteme sunulamamaktadır (Ghahramani,2004, s.3). Bir başka ifade ile, girdi çıktı ikilisi bulunmamakta ancak üretilen çıktının doğru ya da yanlış olduğu sisteme çevre tarafından, çevre durumundaki değişimle belirtilmektedir (Kaelbling / Littman / Moore, 1995, s.239) Bu öğrenme stratejisini kullanan ağlara örnek olarak Doğrusal vektör parçalama modeli (LVQ) ağı verilebilir. Bu ağlar içerisinde hem istatistik biliminin yaklaşımı çerçevesinde hem de kullanım alanı ve sıklığı yönüyle bakıldığında çok katmanlı algılayıcılar en önde gelen ağ yapısı olmaktadır. Sonuç olarak bu çalışmanın ilerleyen başlık, alt başlık ve bölümlerinde ele alınacak ağlar öğretmenli öğrenme stratejisini kullanan ağlar olacağından, öğrenme ya da eğitim ile öğretmenli öğrenme kastediliyor olacaktır. 44 I. YAPAY SİNİR AĞLARINDA TARİHSEL GELİŞİM 1890 yılında William James “Psychology (Briefer Course)” adlı yayınıyla insan beyninin yapısı ve fonksiyonlarıyla ilgili ilk çalışmayı yapmıştır. Onun oluşturduğu genel konsept sinir ağı çalışmalarında halen kullanılmaktadır (Wiggins / Looper, 1991, s.1). 1911 yılında insan beyninin nöronlardan oluştuğu fikri genel kabul görmüştür. 1940’lardan önce bazı yapay sinir ağı çalışmaları olsa da, bu alanda ilk ciddi çalışmanın 1943 yılındaki Warren McCulloch ve Walter Pitts tarafından yapıldığı kabul edilir. Matematiksel işleyişine temel modeller başlığı altında değinilecek olan bu model basit bir ikili eşik değer ünitesi içermektedir. Öte yandan her ne kadar basit bir model olarak ifade edilse de, McCulloch - Pitts yapay sinir hücresi, temelde dijital bilgisayarların çalışma prensiplerine eşdeğer olarak gösterilmektedir (Abu-Mostafa, 1986, s.7). 1950’lerin sonuna gelindiğinde iki yeni gelişme yaşanmıştır, bunlar sırsıyla basit algılayıcıların geliştirilmesi ve ADALINE ünitesinin ortaya konulmasıdır. Basit algılayıcı, Rosenblat tarafından örüntü sınıflandırma amacıyla geliştirilmiştir (Wendemuth, 2006, s.1). ADALINE ise Widrow ve Hoff’un çalışmaları sonucu ortaya konulmuş ve doğrusal örüntü tanımlama amacıyla geliştirilmiştir (Öztemel, 2003, s. 68). Bu iki modelin matematiksel işleyişi de yine temel modeller başlığı altında sunulacaktır. Yapay sinir ağı çalışmaları tarihinde Marvin Minsky ve Seymour Papert’in 1969 yılında yayınladıkları ‘Perceptons’ adlı kitap önemli bir yer tutmaktadır. Minsky ve Papert bu çalışmalarında XOR problemi olarak adlandırılan ve doğrusal olmayan bir ilişkiyi gösteren probleme basit algılayıcıların çözüm getiremediğini göstermişlerdir. Oysa Rosenblatt geliştirdiği basit algılayıcı modellerinin sonlu sayıda iterasyonla ilgili sınıflandırma problemini çözebileceğini yada sinir ağı terminolojisindeki tanımıyla örüntü tanımlanmasını yapabileceğini (öğrenebileceğini) belirtmektedir. Bu sonuç, Rosenblatt’ın haksız olduğunu göstermiş ve yapay sinir ağlarına olan ilgiyi ve bununla ilişkili olarak finansal desteği azaltmıştır. 70’lerde ve 80’lerin başında hemen hepsi Asya yada Avrupada bulunan sınırlı sayıda araştırmacı yine az sayıda çalışmayla yapay sinir 45 ağı konusunda çalışmalarda bulunmuştur ve bu araştırmacılar genellikle nörobiyolojist yada matematikçilerden oluşmaktadır (Wiggins / Looper, 1991, s.1). Öte yandan Amari, 1970’leri pratikte karanlık periyot olarak adlandırırken teorik çalışmalar için ise o denli karanlık olmadığını belirtmektedir (Amari, 1994, s. 32). Ayrıca, bu yıllarda ilginin azlığı yalnızca Minsky ve Papert’ın çalışmalarını ortaya koyduğu olumsuzluklardan değil aynı zamanda bilgisayar teknolojisinin 60 ve 70’li yıllarda gösterdiği hızlı gelişimin, araştırmacıların kafasında sembol işlemlerinin bilgisayarda çok daha hızlı ve güçlü yapılabileceği olgusunu da yaratmış olmasındandır (Cheng / Titherington, 1994a, s.51). Aslında 70’li yıllarda yapılan çalışmalara bakıldığında Amari bir yönüyle de haklıdır. Çünkü 80’lerede geliştirilecek birçok yeniliğin temelleri bu yıllarda atılmıştır. 1972’de çağrışımlı bellek üzerine ilk çalışmalar Kohonen tarafından yapılmış, kendi kendini organize edebilen özellik haritalarının (SOM), üzerine ilk çalışmalara 1973’te Von der Malsburg tarafından başlanmıştır. Yine, XOR probleminin çözümünü verecek Geriye yayılım algoritması üzerine ilk çalışmalara Werbos tarafından 1974 yılında başlanmıştır. 1976 yılında Grosberg tarafından ortaya konulan Adaptif Rezonans Teorisi ağları ve 1982’de Kohonen’in SOM modelini geliştirmesi bunu takip etmiştir. Bu dönemden sonra Hopfield’ın 1982 yılındaki çalışmaları sonucunda içeriği ile adreslenebilen hafıza (Content-addressable Memory) ve 1985 yılında Tank ile beraber yayınladıkları ‘Optimizasyon Problemlerinde Kararların Nöral Hesaplamaları’ adlı makaleyle yapay sinir ağlarına olan ilgiyi tekrar yavaş yavaş artmaya başlamıştır. Bu çalışmada Hopfield ve Tank yapay sinir ağlarının genelleştirilebileceğini ve o zaman için geleneksel bilgisayar programlama yaklaşımıyla çözümlemesi zor olan gezgin satıcı probleminin yapay sinir ağları ile çözümlenebileceğini göstermektedir (Warner / Misra, 1996, s. 286). Yine aynı yıllarda McClelland, Rumelhart ve PDP (Paralel Dağıtılmış İşlemler) araştırma grubu Werbos’un başlattığı çalışmaları geliştirerek çok katmanlı algılayıcılarda geriye yayılım algoritmasının kullanımını ve bunun sonucunda da XOR probleminin çözümünü gerçekleştirmişlerdir. XOR probleminin çözümünden sonra dikkatler tekrar yapay sinir ağı çalışmaları üzerine toplanmıştır ve bu nedenle XOR problemi yapay sinir ağı çalışmalarında önemli bir kilometre taşıdır (Öztemel, 2003, s.76). Geriye yayılım algoritması ile çok 46 katmanlı algılayıcılar bir çok alanda uygulama imkanı bulmuştur. 1988 yılında radial temelli fonksiyon modelleri ve 1989’da olasılıksal sinir ağlarından sonra 1991 yılında genelleştirilmiş regresyon sinir ağları modelleri geliştirilmiştir. 1991 yılından günümüze yapılan çalışma ve uygulama sayısı oldukça fazlalaştığından konumuzu ilgilendiren kısmıyla yani iktisadi zaman serileri alanında yapılan belli başlı çalışmalara değinerek devam etmek daha uygun olacaktır. Yapay sinir ağlarının zaman serisi analizinde ciddi bir şekilde kullanıldığı çalışmalardan ilki 1988 yılında White tarafından yapılmıştır. White makalesinde yapay sinir ağlarını etkin piyasa hipotezini test etmek amacıyla kullanmıştır. İlgili yapay sinir ağı modelinde kaç katman kullanılacağı ve katmanlardaki sinir hücrelerinin sayısının ne olacağı gibi araştırmacının bilgi tecrübe ve becerisine bırakılmış yada diğer bir ifade ile subjektivitenin hakim olduğu ve bir takım sorulara tam bir yanıtın olmayışı, bu yıllarda araştırmacıları yapay sinir ağı modellerine biraz soğuk bakmasını beraberinde getirse de, 1989-93 yılları arasında Cybenko (1989), Funahashi (1989), Hornik (1989, 1991, 1993) ve Hornik, Stinchcombe and White (1989, 1990), tarafından yapılan teorik çalışmalar bu anlamdaki şüpheleri gidermiştir (Kuan, 2006, s.1). Bu tarihten sonra da finansal ve ekonomik temelli çalışmalar hızla artmıştır. Her bir çalışmaya değinemeyeceğimizden literatürde sıklıkla atıf alan çalışmalar şu şekilde özetlenebilir. Bosargei (1993), White’ın çalışmasının üzerine giderek yapay sinir ağı modelleriyle önemli ölçüde doğrusal dışılık tespit ettiği Standart and Poors 500, Ham petrol, Yen- Dolar paritesi ve Nikkei endekslerini başarılı şekilde tahmin etmiştir. Hisse senetleri piyasaları üzerine benzer çalışmalar ve başarılı tahminler Zeidenberg (1995), Refenes (1995), Heiemstra (1996), ve yine aynı yıllarda Hoefhe (1996) ve Helmestien (1996) tarafından da yapılmıştır. Ramazan Gençay’ın (1994) ileri beslemeli ağların küçük veri setlerinde zaman serilerindeki gürültüyü filtreleme yeteneklerini ölçmek üzere yaptığı çalışma bu alandaki önemli çalışmalar arasında gösterilmektedir. Kaastra (1996) tarım ekonomisi alanında tahminleme de yapay sinir ağlarını kullanmıştır. Cheng (1996) ise ABD 47 hazine bonolarının getiri tahminlerinde başarılı bir çalışma yapmıştır. Donalson ve Kamstra (1997) çok katmanlı algılayıcıya dayanan yarıparametrik doğrusal dışı GARCH modeli ile hisse senedi getiri volatilitesini tahmin etmiştir. Franses ve Draisma (1997) mevsimsel bileşenin nasıl ve ne zaman değiştiğini ortaya koymak için yapay sinir ağları ile çalışan bir metot geliştirmişlerdir. Olasılıksal sinir ağları ile iflas tahminleri üzerine Yang (1997) tarafından yapılan başarılı bir çalışmada bunlara eklenebilir. Diğer taraftan, Elkateb (1998) elektrik talebi tahmini çalışması ve Franses ile Griensven (1999) tarafından döviz kurları için al-sat sinyali tahmini amacıyla yaptıkları çalışmalarda literatürdeki önemli çalışmalar arasında gösterilebilir. Kapaetnios (2000), ARCH yapısının testi için sinir ağı modeli kullanmış ve diğer taraftan Heinmann (2000), rasyonel bekleyişlerin uyarlayıcı öğrenilmesi üzerine sinir ağı modelleri geliştirmiştir. Qi (2001), resesyon ve konjonktür tahmininde yapay sinir ağı modeli kullanmıştır. Tkacz (2001), milli gelir tahmininde, Chen (2001) enflasyon tahmininde, Tseng (2001), sanayi üretim endeksi tahmininde yapay sinir ağı modellerini kullandığı görülmektedir. Bu değinilen çalışmalar yapay sinir ağlarının finansal ve ekonomik temelli çalışmalarda da güvenle kullanılabileceğini kanıtladıklarından dolayı 2001 yılı sonrasında yapay sinir ağı çalışmaları ekonomi biliminde de hızla artmış, günümüzde yapay sinir ağları ekonomi ve finans konularında kullanışlı bir istatistiksel araç olarak görülmeye başlanmıştır. Sonuçta, McClelland’ın yapay sinir ağları geldi – gitti, şimdi yine aramızda ve kalacağa benziyor yakıştırması (McClelland, 1994, s.42) gerçekleşmiştir. Bu anlamda yapay sinir ağlarının gittikçe artan bir oranda ekonomi ve finans alanında kullanılmasının arkasında yatan başlıca iki önemli neden belirtilebilir. Bunlarda birincisi, regresyon yaklaşımının aksine yapay sinir ağlarının tahmin edilecek parametrelere doğrusallık ile ilgili herhangi bir kısıt getirmemesidir. İkinci önemli neden ise, yapay sinir ağı modellerinin yine regresyonun aksine, veri kümesinin sahip olduğu dağılım üzerine herhangi bir varsayımda bulunmamasıdır. Böylece daha yüksek dereceden karmaşıklığın yakalanmasında modelleme aracı çok daha esnek bir yapıdadır. Yapay sinir ağlarının özellikle ekonomik önraporlama alanında kullanımında, parametrelere 48 doğrusallıkla ilgili herhangi bir kısıt getirilmemesi ve veri setinin dağılımına ilişkin herhangi bir varsayımda bulunulmaması regresyon modellerine karşılık yapay sinir ağı modellerinin açık bir avantajıdır (Tal / Nazareth, 1995, s.71). II. YAPAY SİNİR AĞLARINDA TERMİNOLOJİ VE TEMEL MODELLER Yapay sinir ağlarının kendine özgü teminolojisi ve özelikle öğrenmelerini öğretmenli öğrenme stratejisine göre gerçekleştiren ağların yapısının anlaşılabilmesi için temel modellerin işleyişinin ortaya konulması gerekmektedir. Bu amaçla bu başlık altında sırasıyla McCulloch – Pitts yapay sinir hücresi, Tek Katmanlı Algılayıcı ve ADALİNE ünitelerinin, çalışma ve öğrenme prensipleri ile yapay sinir ağları alanının kendine özgü terminolojisi birlikte sunulacaktır. Öte yandan temel modeller olarak tanımlanabilecek bu modellere geçmeden önce, yapay sinir ağlarında temel yapı ve elemanların sunulması gerekmektedir. A. YAPAY SİNİR AĞLARINDA TEMEL YAPI VE ELEMANLAR Önceki başlık altında belirtildiği gibi yapay sinir ağları insan beyninin işleyişinden esinlenerek ortaya konulmuş modellerdir. İnsan beyni sinir hücrelerinin ve bu hücreler arasındaki bağlantıların işleyişiyle çalışmasını gerçekleştirir. İnsan beyninin avantajı, yüksek derecede paralel hesaplama yapabilen bir yapıya sahip olma ve bununla ortaya çıkan bilgi işleme yeteneğidir (Abraham, 2005, s.901). Bunun yanında elbette insan beyninin nasıl çalıştığının cevabı tek bir sinir hücresinde bulunamaz. Ancak yapay sinir ağları alanında kullanılan terminolojinin büyük bir kısmı biyolojiden alınmıştır (Francis, 2001, s56). Bu nedenle tek bir sinir hücresinden başlayarak devam edilmesi önem arz etmektedir. Aşağıdaki şekilde tek bir biyolojik sinir hücresinin yapısı görülmektedir 49 Şekil 4: Biyolojik Sinir Hücresinin Yapısı Biyolojik bir sinir hücresinin yapısı yukarıda şekil 4’te ana hatlarıyla gösterilmiştir. Şekilden de anlaşılacağı gibi, bir biyolojik sinir hücresinde başlıca dört ana eleman vardır. Bunlar Dentrit, Çekirdek, Akson ve Bağlantı elemanlarıdır. Biyolojik sinir hücresinin işleyişi şu şekilde gerçekleşmektedir: Bir hücreden diğerine bağlantı elemanlarıyla gelen elektrik sinyali, girdi kanalları olarak adlandırılabilecek dentrit tarafından alınır. Alınan sinyal çekirdek tarafından işlenerek bir çıktıya dönüştürülür. Bu yeni elektrik sinyali akson yardımıyla dentritlere ve oradan da bağlantı elemanlarına geçirilir. Böylece bir sinir hücresinin çıktısı bu son bağlantı elemanlarının sayesinde başka bir sinir hücresinin girdisi olacak şekilde yol alır. Bu işleyiş algılamayı yapacak ağ boyunca paralel olarak tekrarlanır. Basitçe anlatılan bu biyolojik işlemler bütünü yapay sinir ağları modellerinin geliştirilmesine dayanak oluşturmuştur (Roberts, 1989, s.481). Çekirdek Bağlantılar Dentrit Hücre Çeperi Akson Diğer Sinir Hücrelerine Bağlantılar 50 Yapay bir sinir hücresinin yapısı ise aşağıda şekil 5’de görülmektedir. Yapay sinir hücresinde başlıca beş eleman vardır. Bunlar, girdiler, ağırlıklar, toplama fonksiyonu, transfer fonksiyonu ve çıktıdır. Şekil 5: Yapay Sinir Hücresinin Yapısı i. Girdiler : Girdiler yapay sinir hücresine dışarıdan alınan bilgilerdir. Bu girdi, kullanılan yapay sinir ağı modeline ve yapay sinir hücresinin bulunduğu katmana göre örneklemden, başka bir sinir hücresinden veya yapay sinir hücresinin kendisinden gelebilir. Bir kümenin kesikli değerleri yada gerçek sayı olabilirler (Shachmurove, 2004, s.12). ii. Ağırlıklar : Biyolojik sinir hücresindeki bağlantı elemanlarının yapay sinir hücresindeki karşılığıdır. Wij gösterimine göre, j. hücre yada girdi ile i. hücre arasındaki bağlantının kuvvetini göstermektedir. Öte yandan ağırlık değerinin sayısal olarak büyük yada küçük veya – yada + olması bu bağlantının önemli yada önemsiz olduğu anlamına gelmeyeceği gibi, bazı durumlarda bu değerin sıfır olması yapay sinir ağı için en önemli olay da olabilir (Öztemel 2003, s.49). Ç I K T I L A R ijw G İ R D İ L E R AĞIRLIKLAR ∑ ϕ ijw ijw Toplam Fonksiyonu Aktivasyon Fonksiyonu 51 iii. Toplam Fonksiyonu : Toplam fonksiyonunun amacı, hücreye gelen net girdi değerinin hesaplanması şeklinde özetlenebilir. Değişik toplam fonksiyonları kullanılabileceği gibi, en basit toplam fonksiyonu şu şekildedir. i ij J=1 Net Girdi = w x i∑ Bu ifadenin anlamı, her bir j. yapay sinir hücresinden gelen çıktı değerinin ( j j i içıktı y x girdi= = = ) wij ağırlığı ile ağırlıklandırılıp toplamlarının alınmasıdır. Öte yandan ağırlıklandırma işleminden sonra her bir değerin çarpımının alınması yada yine ağırlıklandırma işleminden sonra en büyük girdinin veya en küçük girdinin net girdi olarak tek başına seçilmesi, pozitif olanların yada negatif olanların net girdi olarak alınması gibi çalışan toplam fonksiyonlarının da kullanıldığı yapay sinir hücreleri vardır (Öztemel, 2003, s.50). iv. Aktivasyon Fonksiyonu : Biyolojik sinir hücresinin çekirdeğinde girdiyi işleyip çıktıya dönüştürmesi işlemi, yapay sinir hücresinde herhangi bir toplam fonksiyonu ile oluşturulan net girdinin bir aktivasyon fonksiyonundan geçirilip çıktıya dönüştürülmesi şeklinde gerçekleştirilir. Araştırmacılar tarafından bugüne kadar çok sayıda farklı fonksiyon aktivasyon fonksiyonu olarak kullanılmış olsa da en fazla tercih edilen aktivasyon fonksiyonları, eşik değer ve lojistik fonksiyonlarıdır (Warner / Mısra, 1996, s.287). Aslında yapay sinir ağının potansiyel hesaplama gücünü ortaya koymak için doğrusal olmayan aktivasyon fonksiyonu kullanmak gerekmektedir (Gonzalez / Castro, 2001, s.5). Bunun yanı sıra kullanılan öğrenme algoritmasına göre belirli bazı aktivasyon fonksiyonlarının seçilmesini gerektirecek durumlar söz konusu olabilir. Örneğin daha sonra ayrıntılı şekilde tartışılacak geriye yayılma algoritmasının kullanıldığı durumda, algoritmanın hesaplama yaklaşımından dolayı aktivasyon fonksiyonunun türevlenebilir olması gerekmektedir. 52 v. Çıktılar : Aktivasyon fonksiyonundan elde edilen değer yapay sinir hücresinin çıktısını oluşturur. Kullanılan yapay sinir ağı modeline göre bu çıktı bir yada birden fazla sayıda olabilir (Cheng ve Titterington,1994a, s.7). B. McCULLOCH - PITTS MODELİ İnsan beyninin modellenmesi açısından ilk çalışmaların sinir hücresi modellemesi üzerine yapıldığı daha önce belirtilmişti. Bu alandaki ilk başarılı çalışmanın 1943 yılında McCulloch ve Pitts tarafından yapıldığı kabul edilir ve oluşturdukları model basit bir ikili eşik değer ünitesi içermektedir (Hetrz / Palmer / Krogh, 1991, s.1). Aşağıda şekil 6’da McCulloch-Pitts modeli görülmektedir. Şekil 6: McCulloch – Pitts Yapay Sinir Hücresi McCulloch ve Pitts modelinin matematiksel formülasyonu şu şekilde verilebilir; ( ( ))i ij i i j y w xϕ µ= −∑ i. yapay sinir hücresi 53 Burada, yi , i. yapay sinir hücresinin çıktısıdır. wij j. yapay sinir hücresinden i. yapay sinir hücresine gelen girdi için ağırlık xi , i. yapay sinir hücresinin girdisi (aynı zamanda bir önceki katmandaki j. yapay sinir hücresinin çıktısı, j yada çıktıjy ) iµ , i. yapay sinir hücresinin eşik değeri ϕ , ise aktivasyon fonksiyonudur. McCulloch ve Pitts modelinde aktivasyon fonksiyonu, 1 , netgirdi 0 ise (net girdi) = 0 , diğer durumlarda ϕ ≥   şeklinde bir adım fonksiyonudur. Bu modelin çalışması şu şekilde gerçekleşir; 1) Girdiler toplam fonksiyonu yardımıyla, i ij J=1 Net Girdi = w jçıktı∑ olarak düzenlenir. 2) Eğer bulunan net girdi değeri eşik değerden büyükse, ( )ij i i j w x µ≥∑ aktivasyon fonksiyonuna sıfırdan büyük bir değer gider, sıfırdan büyük bir değer de kullanılan bu adımsal aktivasyon fonksiyonundan geçirildiğinde çıktı 1 olarak bulunur. Bu durum yapay sinir hücresinin aktif olduğu anlamına gelmektedir. Ayrıca yapay sinir hücresinin ateş ettiği (fire) şeklinde de adlandırılmaktadır (Warner / Mısra, 1996, s. 285). 54 3) Eğer bulunan net girdi eşik değerden küçükse, ( )ij i i j w x µ<∑ aktivasyon fonksiyonunda işlenecek değer sıfırdan küçüktür ve bu durumda aktivasyon fonksiyonu 0 değerini üretir. Bilgisayarlarda yapılan hesaplamalar bir küme McCulloch – Pitts yapay sinir hücresi ile başarılabilir (Abu- Mostafa 1986, s.6). C. BASİT ALGILAYICI MODELİ Daha önce de değinildiği gibi Basit algılayıcı modeli 1958 yılında Rosenblatt tarafından geliştirilmiştir. Modelin temel amacının örüntü tanıma yada sınıflandırma olduğu söylenebilir. Bu ağda kullanılan yapay sinir hücreleri aynen McClulloch-Pitts modelindeki yapay sinir hücrelerine benzer hücrelerdir (Hagan / Demuth, 1999, s.4-2) Rosenblatt tarafından birçok çeşidinin ilk kez dizayn edilip kullanıldığı bu modelin en basit hali, sunulan girdi vektörüne karşılık doğru çıktı vektörünün, hataların azaltılması yönünde ağırlıkların güncellenerek eğitimi ile elde edildiği tek katmanlı ve tek hücreden oluşan ağdır ve ismi de algı anlamına gelen “perception” kelimesinden gelmektedir (Veelentruf, 1995, s.10). Bu şekildeki bir basit algılayıcının öğrenme algoritması bir örnek üzerinde açıklanacaktır. Ancak öncelikle daha önce tarihçe bölümünde de değinilen ve yapay sinir ağı çalışmalarına sekte vuran Minsky ve Papert (1969) yayınladıkları ‘Perceptons’ adlı çalışma ve bu çalışma sonucu değinilen problemi hatırlamada yarar vardır: Rosenblatt’a göre “basit algılayıcılar her türlü örüntü tanıma problemi için sonlu sayıda iterasyonla çözüm oluşturacak uygun bir araçtır”. Ancak çözebildikleri problemler için hı