Döviz Kuru Tahmini için Hibrit Dalgacık-ARNN-ARIMA Modeli

1. Giriş

Günlük işlem hacmi 5 trilyon doları aşan döviz (Forex) piyasası, önemli fırsatlar ve riskler sunar. Etkili işlem stratejileri için doğru fiyat tahmini hayati önem taşır. Ancak, Forex verileri yüksek oynaklık, gürültü ve karmaşık doğrusal olmayan kalıplarla karakterize edilir ve bu da tahmini son derece zorlaştırır. ARIMA gibi geleneksel doğrusal modeller genellikle bu dinamikleri yakalamakta yetersiz kalır. Bu makale, Forex zaman serilerinin hem doğrusal hem de doğrusal olmayan bileşenlerini ele almak ve üstün tahmin performansı hedeflemek için Dalgacık Gürültü Giderme, Dikkat Tabanlı Yinelemeli Sinir Ağı (ARNN) ve Otoregresif Bütünleşik Hareketli Ortalama (ARIMA) modelini sinerjik bir şekilde birleştiren yeni bir hibrit metodoloji önermektedir.

2. İlgili Literatür

2.1 Dalgacık Gürültü Giderme

Dalgacık Dönüşümü, zaman-frekans analizi için güçlü bir araçtır ve durağan olmayan finansal verilerde sinyali gürültüden etkili bir şekilde ayırır. Bir zaman serisini yaklaşım ve detay katsayılarına ayrıştırarak, altta yatan trendleri ve otokorelasyon yapılarını gizleyebilecek yüksek frekanslı gürültü bileşenlerinin seçici olarak kaldırılmasına olanak tanır. Bu, model girdi kalitesini iyileştirmek için kritik bir ön işleme adımıdır.

2.2 Finansta Sinir Ağları

Sinir Ağları, özellikle Yinelemeli Sinir Ağları (RNN'ler) ve LSTM'ler gibi varyantları, karmaşık, doğrusal olmayan finansal zaman serilerini modellemede umut vaat etmiştir. Transformer gibi modellerde görüldüğü gibi dikkat mekanizmalarının entegrasyonu, ağın bir tahmin yapmak için geçmişteki en ilgili gözlemlere odaklanmasına izin vererek sıra modelleme yeteneklerini geliştirir.

2.3 Hibrit Tahmin Modelleri

"Ayrıştırma ve topluluk" paradigması iyi yerleşmiştir. Temel fikir, farklı veri özelliklerini (örn., doğrusal vs. doğrusal olmayan, trend vs. mevsimsellik) yakalamak için farklı modeller kullanmak ve ardından tahminlerini birleştirmektir. Bu makalenin katkısı, ön işleme için dalgacık gürültü giderme, doğrusal olmayan kalıplar için ARNN ve kalan doğrusal bileşenler için ARIMA'nın spesifik kombinasyonunda yatmaktadır.

3. Metodoloji

3.1 Veri Ön İşleme & Dalgacık Gürültü Giderme

Orijinal Forex fiyat serisi $P_t$, Ayrık Dalgacık Dönüşümü (DWT) kullanılarak ayrıştırılır: $P_t = A_J + \sum_{j=1}^{J} D_j$, burada $A_J$ yaklaşım katsayısıdır (düşük frekanslı trend) ve $D_j$ detay katsayılarıdır ($j$ seviyesindeki yüksek frekanslı gürültü). Gürültüyü bastırmak için detay katsayılarına bir eşikleme fonksiyonu (örn., yumuşak eşikleme) uygulanır ve ardından gürültüsüz seri $\tilde{P}_t$'yi elde etmek için yeniden yapılandırma yapılır.

3.2 Dikkat Tabanlı RNN (ARNN) Mimarisi

Model, bir dikkat katmanına sahip bir kodlayıcı-kod çözücü RNN çerçevesi kullanır. Kodlayıcı (LSTM hücreleri), girdi dizisi $\tilde{P}_{t-n:t-1}$'yi işler ve bir gizli durum dizisi $h_i$ üretir. Dikkat mekanizması, bu kodlayıcı durumlarının ağırlıklı bir toplamı olarak bir bağlam vektörü $c_t$ hesaplar: $c_t = \sum_{i=1}^{n} \alpha_{t,i} h_i$, burada dikkat ağırlıkları $\alpha_{t,i}$ bir ileri beslemeli ağ tarafından öğrenilir. Daha sonra kod çözücü LSTM, doğrusal olmayan bileşen $\hat{N}_t$'yi tahmin etmek için $c_t$'yi ve önceki durumunu kullanır.

3.3 ARIMA Model Spesifikasyonu

ARIMA(p,d,q) modeli, zaman serisindeki doğrusal ilişkiyi uydurur. ARNN doğrusal olmayan kısmı yakaladıktan sonra, kalan seri $R_t = \tilde{P}_t - \hat{N}_t$ ARIMA tarafından modellenir: $\phi(B)(1-B)^d R_t = \theta(B) \epsilon_t$, burada $\phi$ ve $\theta$ AR ve MA polinomlarıdır, $B$ geri kaydırma operatörüdür, $d$ fark alma derecesidir ve $\epsilon_t$ beyaz gürültüdür. Bu, doğrusal tahmin $\hat{L}_t$'yi verir.

3.4 Hibrit Entegrasyon Stratejisi

Nihai tahmin $\hat{P}_t$, iki bileşen modelin tahminlerinin basit bir toplamsal kombinasyonudur: $\hat{P}_t = \hat{N}_t + \hat{L}_t$. Bu, doğrusal ve doğrusal olmayan bileşenlerin toplamsal olduğu ve modelleme süreci tarafından etkili bir şekilde ayrıldığı varsayımına dayanır.

Temel Performans Metriği

1.65

HKHO

Yön Doğruluğu

~%76

Tahmin Başarı Oranı

Forex Piyasası Ölçeği

>$5T

Günlük Hacim

4. Deneysel Sonuçlar

4.1 Veri Seti & Deneysel Kurulum

Deneyler, yüksek frekanslı USD/JPY beş dakikalık döviz kuru verileri üzerinde gerçekleştirilmiştir. Veri seti eğitim, doğrulama ve test setlerine ayrılmıştır. Karşılaştırma için temel modeller arasında bağımsız ARIMA, standart LSTM ve ilgili literatürden diğer sinir ağı mimarileri yer almıştır.

4.2 Performans Metrikleri & Karşılaştırma

Önerilen hibrit model, 1.65 Kök Ortalama Kare Hatası (HKHO) ve yaklaşık %76 yön doğruluğu (DA) elde etmiştir. Bu, tüm temel modelleri geride bırakmıştır. Örneğin, bağımsız bir ARIMA modeli ~%55-60 DA sağlayabilirken, standart bir LSTM ~%65-70'e ulaşabilir; bu da hibrit yaklaşımın ve ön işlemenin değerini vurgulamaktadır.

4.3 Sonuç Analizi & Tartışma

Yön doğruluğundaki önemli iyileşme, özellikle doğru fiyat hareket yönünün (yukarı/aşağı) tahmin edilmesinin genellikle tam fiyat noktasından daha kritik olduğu işlem uygulamaları için dikkate değerdir. HKHO'daki azalma, genel tahmin hatasının minimize edildiğini göstermektedir. Sonuçlar, dalgacık gürültü gidermenin girdiyi stabilize ettiği ve hibrit modelin hem doğrusal hem de doğrusal olmayan bağımlılıkları etkili bir şekilde yakaladığı hipotezini doğrulamaktadır.

5. Teknik Analiz & Uzman Görüşleri

Temel İçgörü

Bu makale, sadece bir başka "finans için yapay zeka" projesi değil; temel bir gerçeği fark eden kurnaz bir mühendislik hamlesidir: finansal piyasalar çok rejimli sistemlerdir. Ne tamamen kaotik ne de tamamen tahmin edilebilirdirler; trend takip eden (doğrusal modellerle yakalanabilir) ve karmaşık, haber odaklı şoklar (doğrusal olmayan modeller gerektiren) dönemleri arasında salınırlar. Yazarların temel içgörüsü, tek bir monolitik ağın bunu çözmesini ummak yerine, mimarinin bu ikiliği açıkça modellemesini zorlamaktır.

Mantıksal Akış

İş akışı zarif bir şekilde mantıklıdır: 1) Sinyali Temizle (Dalgacık Gürültü Giderme): Bu tartışmasızdır. Ham, gürültülü yüksek frekanslı verileri herhangi bir modele beslemek, gürültü gradyanı domine edeceğinden sorun çıkarmaya davetiyedir. Dalgacıkların kullanımı, yerel özellikleri koruduğu için basit hareketli ortalamalardan üstündür. 2) Böl ve Yönet (Doğrusal olmayan için ARNN, doğrusal için ARIMA): Bu ustaca bir hamledir. Makine öğrenimindeki "Öğle Yemeği Bedava Değil" teoremi ilkesini takip eder—hiçbir tek model tüm problemler için en iyisi değildir. Uzmanlaşmış aracın (ARIMA) iyi anlaşılmış doğrusal otokorelasyonu ele almasına izin verin, güçlü ancak veri aç olan ARNN'nin yalnızca karmaşık, doğrusal olmayan kalıpları çözmeye odaklanmasını sağlayın. 3) Yeniden Birleştir (Toplamsal Entegrasyon): Yakalanan bileşenlerin dikliği varsayıldığında, basit toplama etkilidir.

Güçlü Yönler & Eksiklikler

Güçlü Yönler: Metodoloji bir dereceye kadar savunulabilir ve yorumlanabilirdir. ARIMA artıklarını ve ARNN dikkat ağırlıklarını inceleyebilirsiniz. Performansı (5-dk FX'te %76 DA) pratik olarak anlamlıdır ve yaygın kıyaslamaları aşmaktadır. Forex'in ötesinde, herhangi bir gürültülü, durağan olmayan seriye (örn., kripto para birimi, oynak emtialar) uygulanabilen sağlam bir çerçevedir.

Eksiklikler & Kritik Boşluklar: Odadaki fil, gerçek dünya işlem simülasyonunun olmamasıdır. Bir test setinde yüksek bir DA ve düşük bir HKHO, karlılık anlamına gelmez. İşlem maliyetleri, kayma ve 5 dakikalık bir penceredeki gecikme, kağıt üzerindeki getirileri yok edebilir. Model tamamen tekniktir; makroekonomik haber akışlarını veya emir defteri verilerini göz ardı eder—bu, günümüzün algoritmik işlem ortamında ciddi bir sınırlamadır. Ayrıca, toplamsal kombinasyon basittir; öğrenilmiş bir ağırlıklandırma mekanizması (örn., bir geçit ağı) DeepMind gibi kurumlardan meta-öğrenme araştırmalarında ima edildiği gibi, piyasa rejimine göre her modelin katkısını dinamik olarak ayarlayabilir.

Uygulanabilir İçgörüler

Kantitatif analistler ve varlık yöneticileri için: Tekrarlayın, ancak ardından genişletin. Bu mimariyi yeni temel çizginiz olarak kullanın. Acil bir sonraki adımlar şunlardır: 1) Alternatif Verileri Dahil Edin: ARNN kodlayıcısına, fiyat verilerinin yanı sıra gerçek zamanlı haber duyarlılık analizinden (FinBERT gibi modeller kullanarak) gömülü vektörler besleyin. 2) Dinamik Ağırlıklandırma Uygulayın: Sabit $\hat{N}_t + \hat{L}_t$'yi $w_t \hat{N}_t + (1-w_t)\hat{L}_t$ ile değiştirin, burada $w_t$ piyasanın mevcut "doğrusal olmama" durumunu tahmin eden küçük bir sinir ağıdır. 3) Sürtünmeyle Geri Test Yapın: Tahminleri maliyetlerle gerçekçi bir geri test motorundan geçirin. %76 DA'nın gerçek değeri ancak bu koşullar altında ortaya çıkacaktır. Bu makale motor bloğunu sağlar; endüstrinin şimdi etrafında işlem aracının geri kalanını inşa etmesi gerekir.

6. Analiz Çerçevesi & Vaka Örneği

Senaryo: Büyük bir merkez bankası açıklaması (örn., ECB basın toplantısı) sırasında EUR/USD için bir sonraki 5 dakikalık mumun tahmini.

Çerçeve Uygulaması:

Dalgacık Ön İşleme: Son 4 saatten (48 veri noktası) gelen ham 5-dk fiyat serisi ayrıştırılır. Açıklama sırasında ani yükselen yüksek frekanslı "detay" katsayıları yoğun şekilde eşiklenir, mikro gürültüyü yumuşatırken ana yön sıçramasını korur.
Model Ayrıştırması:
- ARIMA Bileşeni: Haberlerden önce var olan altta yatan momentum ve ortalamaya dönüş eğilimini modeller. Tahmini, haber öncesi trendin hafif bir devamı olabilir.
- ARNN Bileşeni: Dikkat mekanizması, en son, oynak haber sonrası fiyat çubuklarına yoğun şekilde odaklanır. Benzer tarihsel "haber şoku" kalıplarından öğrenerek, olası kısa vadeli aşırı tepkiyi ve sonraki kısmi geri çekilmeyi tahmin eder.
Hibrit Tahmin: Nihai tahmin = (ARIMA'nın trend tabanlı tahmini) + (ARNN'nin haber etkisi ayarlaması). Bu, tek başına ya ARIMA'nın az tepki vermesi ya da standart bir RNN'nin ham veride gürültüye aşırı uyum sağlamasından daha nüanslıdır.

7. Gelecek Uygulamalar & Yönelimler

Çoklu Varlık & Çapraz Piyasa Tahmini: Çerçeveyi, Forex çiftleri, hisse senetleri ve tahviller arasındaki korelasyonları modellemek için genişletin. ARNN kodlayıcısı, birden fazla ilgili zaman serisini aynı anda işleyebilir.
Pekiştirmeli Öğrenme (RL) ile Entegrasyon: Hibrit modelin tahminlerini, tahmin hatası yerine doğrudan karı optimize eden optimal işlem yürütme politikalarını öğrenen bir RL ajanı için durum temsili olarak kullanın.
Açıklanabilir Yapay Zeka (XAI) Geliştirmeleri: Nihai tahmini, spesifik doğrusal trendlere (ARIMA katsayıları aracılığıyla) ve spesifik geçmiş zaman noktalarına (ARNN dikkat haritaları aracılığıyla) atfetmek için yöntemler geliştirin; işlemcilere tahmin için uygulanabilir nedenler sağlayın.
Uyarlanabilir Çevrimiçi Öğrenme: Modelin, değişen piyasa rejimlerine uyum sağlamak için yeni verilerle parametrelerini akış halinde sürekli güncellemesi için mekanizmalar uygulayın; statik eğitim-test paradigmalarının ötesine geçin.

8. Referanslar

Uluslararası Ödemeler Bankası (BIS). (2019). Döviz ve tezgah üstü türev piyasaları üç yıllık merkez bankası anketi.
Box, G. E. P., Jenkins, G. M., Reinsel, G. C., & Ljung, G. M. (2015). Zaman serisi analizi: tahmin ve kontrol. John Wiley & Sons.
Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., ... & Polosukhin, I. (2017). Attention is all you need. Advances in neural information processing systems, 30.
Zhang, G. P. (2003). Time series forecasting using a hybrid ARIMA and neural network model. Neurocomputing, 50, 159-175.
Hochreiter, S., & Schmidhuber, J. (1997). Long short-term memory. Neural computation, 9(8), 1735-1780.
Wolpert, D. H., & Macready, W. G. (1997). No free lunch theorems for optimization. IEEE transactions on evolutionary computation, 1(1), 67-82.
DeepMind. (2023). Uyarlanabilir Ajanlarda Araştırma. https://www.deepmind.com/research/highlighted-research/adaptive-agents adresinden alındı.