हाइब्रिड वेवलेट-ARNN-ARIMA मॉडल फॉर फॉरेन एक्सचेंज प्राइस प्रेडिक्शन

1. परिचय

विदेशी मुद्रा बाजार का दैनिक कारोबार 5 ट्रिलियन डॉलर से अधिक है, जिसमें अपार अवसर और जोखिम दोनों निहित हैं। प्रभावी व्यापारिक रणनीतियाँ बनाने के लिए सटीक मूल्य पूर्वानुमान अत्यंत महत्वपूर्ण है। हालांकि, विदेशी मुद्रा डेटा में उच्च अस्थिरता, अत्यधिक शोर और जटिल अरैखिक पैटर्न जैसी विशेषताएं होती हैं, जो पूर्वानुमान को अत्यधिक चुनौतीपूर्ण बनाती हैं। पारंपरिक रैखिक मॉडल (जैसे ARIMA) अक्सर इन गतिशील विशेषताओं को पकड़ने में विफल रहते हैं। यह पेपर एक नवीन मिश्रित विधि प्रस्तुत करता है, जो सहक्रियात्मक रूप से संयोजित करता हैतरंगिका शोर निवारण、ध्यान तंत्र-आधारित आवर्तक तंत्रिका नेटवर्क (ARNN)和स्वतः प्रतिगामी समाकलित चल औसत (ARIMA)मॉडल, जिसका उद्देश्य विदेशी मुद्रा समय श्रृंखला में क्रमशः रैखिक और अरैखिक घटकों को संसाधित करके बेहतर पूर्वानुमान प्रदर्शन प्राप्त करना है।

2. संबंधित साहित्य

2.1 तरंगिका शोर निवारण

Tarang rupantaran ek shaktishali samay-awritti vishleshan upkaran hai, jo asthir vitiya aankadon mein sanket aur shor ko prbhavi roop se alag kar sakta hai. Samay shreni ko anumanit gudank aur vivaran gudank mein viyojit karke, uchch-awritti shor ghatakon ko chhant kar hataya ja sakta hai jo sambhavit pravritti aur swasahcharan sanrachna ko chhupa sakte hain. Yeh purv-prakriya pad model aadhar ki gunnvatta ko badhane ke liye mahatvpurn hai.

2.2 वित्तीय क्षेत्र में तंत्रिका नेटवर्क

Neural network, vishesh roop se recurrent neural network (RNN) aur iske prakaar (jaise LSTM), jateel non-rekhiya vitiya samay shreniyon ke model banane mein kshamta dikhate hain. Dhyan tantr ka ekikaran (jaise Transformer model mein dikhaya gaya hai) network ko un aitihasik avlokan par dhyan kendrit karne mein saksham banata hai jo poorvanuman ke liye sabase adhik prasangik hain, jisse samay shreni model banane ki kshamta badhti hai.

2.3 मिश्रित पूर्वानुमान मॉडल

"Viyojan aur ekikaran" pratiman vyapak roop se svikrit ho chuka hai. Iska mool vichar alag-alag modelon ka upyog karke vibhinn aankade visheshtao ko (jaise, rekhiya aur non-rekhiya, pravritti aur mausami) pakadna hai, phir unke poorvanuman parinamon ko milana hai. Is paper ka yogdan tarang apohan ko purv-prakriya ke liye, non-rekhiya patrnon ke liye ARNN aur shesh rekhiya ghatakon ke liye ARIMA ko vishesh roop se jodna hai.

3. कार्यप्रणाली

3.1 डेटा प्रीप्रोसेसिंग और वेवलेट डीनॉइज़िंग

मूल विदेशी मुद्रा मूल्य श्रृंखला $P_t$ को असतत तरंगिका रूपांतरण (DWT) का उपयोग करके विघटित किया जाता है: $P_t = A_J + \sum_{j=1}^{J} D_j$, जहाँ $A_J$ सन्निकटन गुणांक (निम्न-आवृत्ति प्रवृत्ति) हैं, और $D_j$ विस्तार गुणांक ($j$-वें स्तर का उच्च-आवृत्ति शोर) हैं। शोर को दबाने के लिए विस्तार गुणांकों पर एक थ्रेशोल्ड फलन (जैसे, सॉफ्ट थ्रेशोल्ड) लागू किया जाता है, फिर शोर-रहित श्रृंखला $\tilde{P}_t$ प्राप्त करने के लिए पुनर्निर्माण किया जाता है।

3.2 अटेंशन मैकेनिज्म-आधारित RNN (ARNN) आर्किटेक्चर

यह मॉडल ध्यान परतों के साथ एक एनकोडर-डिकोडर RNN ढांचे का उपयोग करता है। एनकोडर (LSTM इकाइयाँ) इनपुट श्रृंखला $\tilde{P}_{t-n:t-1}$ को संसाधित करता है और छिपी अवस्थाओं $h_i$ की एक श्रृंखला उत्पन्न करता है। ध्यान तंत्र एक संदर्भ सदिश $c_t$ की गणना करता है, जो इन एनकोडर अवस्थाओं का भारित योग होता है: $c_t = \sum_{i=1}^{n} \alpha_{t,i} h_i$, जहाँ ध्यान भार $\alpha_{t,i}$ एक फीड-फॉरवर्ड नेटवर्क द्वारा सीखे जाते हैं। डिकोडर LSTM तब अरैखिक घटक $\hat{N}_t$ की भविष्यवाणी करने के लिए $c_t$ और अपनी पिछली अवस्था का उपयोग करता है।

3.3 ARIMA मॉडल सेटअप

ARIMA(p,d,q) model fits the linear relationships in the time series. After the ARNN captures the nonlinear component, the residual sequence $R_t = \tilde{P}_t - \hat{N}_t$ is modeled by ARIMA: $\phi(B)(1-B)^d R_t = \theta(B) \epsilon_t$, where $\phi$ and $\theta$ are the AR and MA polynomials, $B$ is the backshift operator, $d$ is the differencing order, and $\epsilon_t$ is white noise. This yields the linear forecast $\hat{L}_t$.

3.4 हाइब्रिड एन्सेम्बल रणनीति

The final forecast $\hat{P}_t$ is a simple additive combination of the predictions from the two component models: $\hat{P}_t = \hat{N}_t + \hat{L}_t$. This assumes that the linear and nonlinear components are additive and have been effectively separated through the modeling process.

Core performance metrics

1.65

Root mean square error

दिशात्मक सटीकता

~76%

पूर्वानुमान सफलता दर

विदेशी मुद्रा बाजार का आकार

>$5万亿

दैनिक कारोबार मात्रा

4. प्रयोगात्मक परिणाम

4.1 डेटासेट और प्रयोग सेटअप

प्रयोग उच्च-आवृत्ति पर आधारित हैUSD/JPY पांच मिनट की विनिमय दर डेटाकिया गया। डेटासेट को प्रशिक्षण सेट, सत्यापन सेट और परीक्षण सेट में विभाजित किया गया है। तुलना के लिए बेसलाइन मॉडल में स्वतंत्र ARIMA मॉडल, मानक LSTM मॉडल और संबंधित साहित्य के अन्य तंत्रिका नेटवर्क आर्किटेक्चर शामिल हैं।

4.2 प्रदर्शन मीट्रिक और तुलना

प्रस्तावित हाइब्रिड मॉडल प्राप्त करता हैमूल माध्य वर्ग त्रुटि (RMSE) 1.65 है，दिशात्मक सटीकता (DA) लगभग 76% हैयह सभी आधारभूत मॉडलों से बेहतर है। उदाहरण के लिए, स्वतंत्र ARIMA मॉडल लगभग 55-60% DA प्राप्त कर सकता है, जबकि मानक LSTM लगभग 65-70% तक पहुँच सकता है, जो मिश्रित विधियों और पूर्व-प्रसंस्करण के मूल्य को उजागर करता है।

4.3 परिणाम विश्लेषण और चर्चा

दिशात्मक सटीकता में उल्लेखनीय वृद्धि व्यापारिक अनुप्रयोगों के लिए विशेष रूप से ध्यान देने योग्य है, क्योंकि व्यापार में मूल्य आंदोलन की सही दिशा (वृद्धि/गिरावट) का पूर्वानुमान सटीक मूल्य बिंदु से अधिक महत्वपूर्ण होता है। RMSE में कमी दर्शाती है कि समग्र पूर्वानुमान त्रुटि को न्यूनतम किया गया है। परिणाम इस परिकल्पना की पुष्टि करते हैं कि तरंगिका शोर निवारण ने इनपुट डेटा को स्थिर किया, और मिश्रित मॉडल ने रैखिक और अरैखिक निर्भरताओं को प्रभावी ढंग से पकड़ा।

5. तकनीकी विश्लेषण और विशेषज्ञ अंतर्दृष्टि

मुख्य अंतर्दृष्टि

यह लेख केवल "वित्त के लिए AI" का एक और प्रोजेक्ट नहीं है; यह एक समझदार इंजीनियरिंग अभ्यास है जो एक मूलभूत तथ्य को पहचानता है: वित्तीय बाजारबहु-तंत्रप्रणालियाँ हैं। वे न तो पूरी तरह से अराजक हैं और न ही पूरी तरह से पूर्वानुमेय; वे ट्रेंड-फॉलोइंग अवधियों (जिन्हें रैखिक मॉडल पकड़ सकते हैं) और जटिल, समाचार-संचालित झटकों की अवधियों (जिनके लिए अरैखिक मॉडल की आवश्यकता होती है) के बीच दोलन करते हैं। लेखक की मुख्य अंतर्दृष्टि हैआर्किटेक्चर को इस द्वैत को स्पष्ट रूप से मॉडल करने के लिए बाध्य करना, न कि यह उम्मीद करना कि एक एकल समग्र नेटवर्क इसे स्वयं हल कर लेगा।

तार्किक प्रवाह

यह प्रक्रिया तार्किक रूप से सुरुचिपूर्ण है: 1) सिग्नल को साफ करना(वेवलेट डीनॉइज़िंग): यह आवश्यक है। किसी भी मॉडल में शोर से भरे उच्च-आवृत्ति डेटा को डालना मुसीबत को आमंत्रित करने जैसा है, क्योंकि शोर ग्रेडिएंट पर हावी हो जाता है। सरल मूविंग एवरेज की तुलना में वेवलेट का उपयोग बेहतर है क्योंकि यह स्थानीय विशेषताओं को संरक्षित करता है। 2) विभाजित करो और शासन करो(ARNN अरैखिकता को संभालता है, ARIMA रैखिकता को): यह एक शानदार विचार है। यह मशीन लर्निंग के"कोई मुफ्त दोपहर का भोजन नहीं" प्रमेयके सिद्धांत का पालन करता है—कोई एकल मॉडल सभी समस्याओं के लिए इष्टतम नहीं है। विशेष उपकरण (ARIMA) को समझने में आसान रैखिक स्वसहसंबंध को संभालने दें, जिससे शक्तिशाली लेकिन डेटा-भूखे ARNN को जटिल अरैखिक पैटर्न की व्याख्या करने पर ध्यान केंद्रित करने की स्वतंत्रता मिलती है। 3) पुनः संयोजित करना(योगात्मक एकीकरण): सरल योग प्रभावी है, बशर्ते यह मान लिया जाए कि पकड़े गए घटक ऑर्थोगोनल हैं।

लाभ और सीमाएँ

लाभ:यह विधि कुछ हद तकबचाव योग्य और व्याख्या योग्य। आप ARIMA अवशेषों और ARNN ध्यान भार की जांच कर सकते हैं। इसका प्रदर्शन (5 मिनट के विदेशी मुद्रा डेटा पर 76% DA) व्यावहारिक महत्व रखता है, और सामान्य बेंचमार्क से आगे है। यह एक मजबूत ढांचा है जिसे विदेशी मुद्रा के अलावा किसी भी शोरगुल वाले, गैर-स्थिर अनुक्रम (जैसे क्रिप्टोकरेंसी, उच्च अस्थिरता वाली वस्तुएं) पर लागू किया जा सकता है।

कमियाँ और प्रमुख दोष:एक स्पष्ट समस्या यह है किवास्तविक व्यापार सिमुलेशन का अभावउच्च DA और निम्न RMSE परीक्षण सेट पर लाभप्रदता के बराबर नहीं होते हैं। 5 मिनट की समय खिड़की में, लेन-देन लागत, स्लिपेज और विलंबता कागजी रिटर्न को पूरी तरह से समाप्त कर सकते हैं। यह मॉडल पूरी तरह से तकनीकी है और मैक्रोइकॉनॉमिक समाचार प्रवाह या ऑर्डर बुक डेटा को अनदेखा करता है - जो आज के एल्गोरिदमिक ट्रेडिंग वातावरण में एक गंभीर सीमा है। इसके अलावा, योगात्मक संयोजन बहुत सरल है; एक सीखी गई भारांक तंत्र (जैसे गेटेड नेटवर्क) जो बाजार की स्थितियों के अनुसार प्रत्येक मॉडल के योगदान को गतिशील रूप से समायोजित कर सकता है, वह विधि है जिसका संकेतDeepMindजैसे संस्थानों ने मेटा-लर्निंग अनुसंधान में दिया है।

कार्रवाई योग्य अंतर्दृष्टियाँ

मात्रात्मक विश्लेषकों और परिसंपत्ति प्रबंधकों के लिए:कॉपी करें, फिर विस्तार करें। इस आर्किटेक्चर को अपने नए बेसलाइन के रूप में उपयोग करें। अगले तत्काल कदम हैं: 1) वैकल्पिक डेटा को एकीकृत करें: Real-time news sentiment analysis (using models like FinBERT) se embeddings vectors ko price data ke saath ARNN encoder mein input karein. Dynamic weighting ko implement karein. Fixed $\hat{N}_t + \hat{L}_t$ ko $w_t \hat{N}_t + (1-w_t)\hat{L}_t$ se badal dein, jahan $w_t$ ek chhota neural network hai jo market ki "non-linearity" ki current degree ka prediction karta hai. Friction ke saath backtesting. Predictions ko ek cost-inclusive realistic backtesting engine mein daalein. DA ka 76% ka asli moolya sirf is case mein dikhta hai. Ye paper engine module provide karta hai; ab industry ko iske aas-paas trading tools ke baaki hisse banana honge.

6. विश्लेषण ढांचा और केस उदाहरण

Scenario: Major central bank announcements (jaise ECB press conference) ke dauran EUR/USD ke agle paanch minute ke K-line ka prediction karein.

Framework Application:

Wavelet Preprocessing: The original 5-minute price series of the past 4 hours (48 data points) is decomposed. The high-frequency "detail" coefficients that spike during the announcement period are heavily thresholded, thereby smoothing micro-noise while preserving the main directional jumps.
Model Decomposition:
- ARIMA Component: Before the news releaseBeforemaujooda sambhaavi momentum aur mean-reversion trends ko model karta hai. iska purvanuman khabar se pahle ke trend ka halka sa jaari rehna ho sakta hai.
- ARNN ghatak: dhyaan tantra neetik roop se sabase haal ke, ati-astir ghoshanottar mooly stambhon par kendrit hota hai. yeh samaan aitihaasik "samaachaar aaghaat" praroopon se seekhkar sambhaavi alpkaalik ati-pratikriya aur uske baad aanshik vapsi ka purvanuman karta hai.
mishrit purvanuman: antim purvanuman = (ARIMA trend-aadharit purvanuman) + (ARNN ka samaachaar prabhav samayojan). yeh kisi bhi alag model se adhik sookshm hai, kyonki alag model ya to kam pratikriya kar sakta hai (ARIMA) ya shor par ati-fit ho sakta hai (maulik aankdon par aadharit maanak RNN).

7. भविष्य के अनुप्रयोग और दिशाएँ

bahu-sampatti evam paar-baajaar purvanuman: इस ढांचे का विस्तार करें ताकि विदेशी मुद्रा जोड़ियों, शेयरों और बॉन्डों के बीच सहसंबंधों का मॉडल तैयार किया जा सके। ARNN एन्कोडर एक साथ कई संबंधित समय श्रृंखलाओं को संसाधित कर सकता है।
सुदृढीकरण सीखने (RL) के साथ एकीकरण: मिश्रित मॉडल के पूर्वानुमानों का उपयोग RL एजेंट के लिए स्थिति प्रतिनिधित्व के रूप में करें, जो पूर्वानुमान त्रुटि के बजाय सीधे लाभ को अनुकूलित करते हुए इष्टतम व्यापार निष्पादन रणनीति सीखता है।
व्याख्यात्मक कृत्रिम बुद्धिमत्ता (XAI) संवर्धन: ऐसी विधियाँ विकसित करें जो अंतिम पूर्वानुमान को विशिष्ट रैखिक प्रवृत्तियों (ARIMA गुणांकों के माध्यम से) और विशिष्ट पिछले समय बिंदुओं (ARNN अटेंशन मैप के माध्यम से) के लिए जिम्मेदार ठहराएँ, जिससे व्यापारियों को पूर्वानुमान के लिए कार्रवाई योग्य कारण मिल सकें।
अनुकूली ऑनलाइन सीखना: ऐसी प्रणाली लागू करें जो मॉडल को स्ट्रीमिंग तरीके से नए डेटा के साथ अपने मापदंडों को लगातार अपडेट करने में सक्षम बनाए, ताकि स्थिर प्रशिक्षण-परीक्षण प्रतिमान से परे बदलते बाजार तंत्रों के अनुकूल हो सके।

8. संदर्भ ग्रंथ सूची

अंतर्राष्ट्रीय निपटान बैंक (BIS). (2019). विदेशी मुद्रा और ओटीसी डेरिवेटिव बाजारों का त्रैवार्षिक केंद्रीय बैंक सर्वेक्षण।
Box, G. E. P., Jenkins, G. M., Reinsel, G. C., & Ljung, G. M. (2015). समय श्रृंखला विश्लेषण: पूर्वानुमान और नियंत्रण। John Wiley & Sons.
Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., ... & Polosukhin, I. (2017). Attention is all you need. तंत्रिका सूचना प्रसंस्करण प्रणालियों में प्रगति, 30.
Zhang, G. P. (2003). एक संकर ARIMA और तंत्रिका नेटवर्क मॉडल का उपयोग कर समय श्रृंखला पूर्वानुमान। Neurocomputing, 50, 159-175.
Hochreiter, S., & Schmidhuber, J. (1997). Long short-term memory. Neural computation, 9(8), 1735-1780.
Wolpert, D. H., & Macready, W. G. (1997). No free lunch theorems for optimization. IEEE transactions on evolutionary computation, 1(1), 67-82.
DeepMind. (2023). Research in Adaptive Agents. https://www.deepmind.com/research/highlighted-research/adaptive-agents से प्राप्त किया गया।