Yaliyomo
1. Utangulizi
Utafiti huu unashughulikia changamoto ya kujenga mfuko bora wa uwekezaji wa mali mbili kwa kutumia mbinu za masomo ya mashine. Utafiti unalenga mfuko unaojumuisha faharasa ya hisa ya S&P 500 na jozi ya sarafu USD/GBP. Lengo kuu ni kutumia data ya uchumi kwa masafa ya kila mwezi na robo mwaka kutabiri mapato ya mali hizi kwa kutumia mbinu za mkusanyiko wa miti—hasa Msitu wa Nasibu na XGBoost. Utabiri huu kisha hutumiwa kama pembejeo za mapato yanayotarajiwa kwa uboreshaji wa nadharia ya kisasa ya mifuko (MPT). Lengo la pili ni kutambua ni vigezo gani vya uchumi vinavyoathiri sana utabiri huo. Utafiti huu unachunguza kwa kina ikiwa mfuko uliojengwa kwenye data iliyokadiriwa na ML unatofautiana kwa maana na ule uliojengwa kwa kutumia wastani rahisi wa kihistoria.
2. Mbinu & Data
2.1 Ukusanyaji wa Data & Utayarishaji wa Awali
Uchambuzi hutumia data ya mfululizo wa wakati kwa faharasa ya S&P 500 na kiwango cha ubadilishaji wa USD/GBP. Seti ya viashiria vya uchumi inakusanywa kama vipengele vinavyoweza kutabiri, ambavyo vinaweza kujumuisha vigezo kama vile viwango vya riba, fahirisi za mfumuko wa bei, takwimu za uzalishaji wa viwanda, na viwango vya ukosefu wa ajira, zilizotolewa kutoka kwa hifadhidata kama FRED. Data imegawanywa katika seti za mafunzo, uthibitishaji, na majaribio, kwa kuzingatia kwa makini kuepuka upendeleo wa kutazamia mbele. Vipengele vinasawazishwa au kuwekwa kwa kiwango kulingana na mahitaji ya miundo.
2.2 Miundo ya Mkusanyiko wa Miti: Msitu wa Nasibu & XGBoost
Algorithms mbili za hali ya juu za mkusanyiko wa kujifunza zimetumika kwa utabiri wa mfululizo wa wakati:
- Msitu wa Nasibu: Mkusanyiko wa miti ya uamuzi iliyofunzwa kwenye sampuli zilizoboreshwa za data kwa uteuzi wa nasibu wa vipengele, na hivyo kupunguza kuzidi kufunza na kutoa utabiri thabiti.
- XGBoost (Uimarishaji wa Gradient Uliozidi): Mfumo unaoweza kuongezeka, uliosawazishwa wa uimarishaji wa gradient unaojulikana kwa kasi na utendaji wake. Hujenga miti kwa mpangilio ili kusahihisha makosa ya miti ya awali, na mara nyingi hutoa matokeo ya hali ya juu kabisa kwenye data iliyopangwa.
Miundo hii imechaguliwa kwa uwezo wake wa kushughulikia uhusiano usio wa mstari na mwingiliano tata kati ya vigezo vya uchumi bila mawazo madhubuti ya kigezo.
2.3 Mfumo wa Ujenzi wa Mfuko wa Uwekezaji
Mapato yaliyotabiriwa kutoka kwa miundo ya ML hutumika kama vekta ya mapato yanayotarajiwa $\mu$ katika mfumo wa uboreshaji wa wastani-tofauti wa Markowitz. Uzito wa mfuko $w$ kwa mali hizo mbili huamuliwa kwa kutatua tatizo la uboreshaji ambalo huongeza uwiano wa Sharpe au kupunguza tofauti kwa lengo la mapato. Matriki ya ushirikiano $\Sigma$ kwa kawaida inakadiriwa kutoka kwa mapato ya kihistoria. Utendaji wa "mfuko wa msingi wa ML" kisha hulinganishwa na mfuko wa kiwango uliojengwa kwa kutumia wastani wa kihistoria wa mapato.
3. Matokeo ya Majaribio & Uchambuzi
3.1 Utendaji wa Utabiri
Miundo ya mkusanyiko wa miti ilionyesha uwezo wa kitakwimu muhimu wa kutabiri mwendo wa mwelekeo na, kwa kiasi kidogo, ukubwa wa mapato kwa S&P 500 na USD/GBP. Vipimo vya tathmini kama vile Kosa la Wastani Kabisa (MAE), Kosa la Mzizi wa Wastani wa Mraba (RMSE), na usahihi wa mwelekeo ziliripotiwa. XGBoost mara nyingi ilionyesha ufa kidogo zaidi kuliko Msitu wa Nasibu kwa suala la usahihi wa utabiri, hasa kwenye data ya robo mwaka, pengine kwa sababu ya utaratibu wake wa hali ya juu zaidi wa uimarishaji na usawazishaji.
3.2 Ulinganisho wa Utendaji wa Mfuko wa Uwekezaji
Maelezo ya Chati: Chati ya mstari ya kulinganisha ingeonyesha mapato ya jumla ya mifuko mitatu katika kipindi cha majaribio nje ya sampuli: 1) Mfuko bora wa msingi wa utabiri wa ML, 2) Mfuko bora wa msingi wa wastani wa kihistoria, na 3) Kiwango cha usawa wa uzani.
Matokeo yalionyesha kuwa mfuko uliojengwa kwa kutumia utabiri wa ML ulipata wasifu bora wa mapato yaliyosawazishwa kwa hatari (uwiano wa juu wa Sharpe) ikilinganishwa na mfuko uliojengwa kwa msingi wa wastani wa kihistoria. Uzito wa mgao wa mali kati ya S&P 500 na USD/GBP pia ulitofautiana kwa maana, ikionyesha kuwa miundo ya ML ilishika mapato yanayotarajiwa yanayobadilika kwa wakati ambayo wastani rahisi wa kihistoria haukuweza kuyashika.
3.3 Uchambuzi wa Umuhimu wa Vipengele
Msitu wa Nasibu na XGBoost wote hutoa alama za asili za umuhimu wa kipengele. Uchambuzi ulifunua kuwa kwa S&P 500, viashiria vya kuongoza kama vile tofauti za muda, hisia za watumiaji, na mabadiliko ya zamani ya soko la hisa yalikuwa miongoni mwa viashiria vya juu. Kwa USD/GBP, tofauti za viwango vya riba, data ya usawa wa biashara, na mienendo pana ya faharasa ya dola ndiyo iliyoathiri zaidi. Ufahamu huu ni wa thamani kwa tafsiri ya kiuchumi na urahisishaji wa mfano.
4. Ufahamu Muhimu & Majadiliano
Ufahamu Msingi
Hoja yenye mvuto zaidi ya karatasi hii sio kwamba ML inaweza kushinda soko—ni kwamba hata maboresho madogo, yanayoweza kuelezewa katika utabiri kupitia mkusanyiko wa miti yanaweza kubadilisha kwa mahesabu ya mipaka yenye ufanisi kwa mfuko rahisi wa mali mbili. Hii inapinga fundisho la kukaa kimya la "weka-na-usahau" kwa wawekezaji wa muda mrefu katika mchanganyiko usio wa hisa/dhamana.
Mtiririko wa Kimantiki
Mantiki ya utafiti ni sahihi: 1) Tumia ML thabiti, isiyo ya kigezo (RF/XGBoost) kwa kuchambua data ya uchumi hadi utabiri wa mapato, na hivyo kuepuka mtego wa miundo ya mstari. 2) Ingiza utabiri huu kwenye injini ya kitamaduni ya Markowitz. 3) Thibitisha kuwa mfuko wa pato unatofautiana na kiwango cha kihistoria cha kijinga. Mtiririko kutoka kwa viendeshi vya uchumi hadi utabiri wa mali hadi uzito wa mfuko ni wazi na unaweza kurudiwa.
Nguvu & Kasoro
Nguvu: Mwelekeo wa vitendo kwenye kesi inayoweza kushughulikiwa ya mali mbili huongeza uwazi. Kutumia miundo ya miti hutoa usio wa mstari wa asili na umuhimu wa kipengele, na hivyo kuongeza uwezo wa kufafanua kiuchumi ambao mara nyingi haupo katika karatasi za kifedha za kujifunza kwa kina. Ulinganisho na msingi wa wastani wa kihistoria ni wa haki na unaohusika.
Kasoro: Tembo katika chumba ni makadirio ya ushirikiano. Utafiti hutumia ushirikiano wa kihistoria, ambao unajulikana kwa kutokuwa thabiti. Muundo wa ushirikiano uliotabiriwa na ML ungeweza kuwa hatua ya mantiki inayofuata lakini haipo. Urahisishaji wa mali mbili, ingawa ni nguvu kwa uwazi, hupunguza faida za utofautishaji ambazo ML zinaweza kufungua katika muktadha wa mali nyingi. Gharama za manunuzi na uwezekano wa vitendo wa kurekebisha tena kila mwezi/robo mwaka kulingana na ishara hizi hazijashughulikiwa.
Ufahamu Unaoweza Kutekelezwa
Kwa watendaji: Usipuuze mbinu rahisi za mkusanyiko kama XGBoost kwa utabiri wa mapato; zinaweza kuwa thabiti zaidi na zinaweza kufafanuliwa kuliko mitandao ya neva kwa data iliyopangwa ya uchumi/kifedha. Viendeshi muhimu vya uchumi vilivyotambuliwa (k.m., tofauti za muda kwa hisa, tofauti za viwango vya riba kwa FX) vinapaswa kuwa mawazo ya juu kwa wachambuzi wanaofuatilia aina hizi za mali. Mbinu hii inastahili zaidi kwa wawekezaji wa taasisi au watu wenye ujuzi ambao wanaweza kutekeleza kwa utaratibu na kurekebisha tena mkakati kama huo, sio kwa wafanyabiashara wa rejareja wanaotafuta alfa ya muda mfupi.
5. Maelezo ya Kiufundi & Mfumo wa Hisabati
Kiini cha uboreshaji wa mfuko ni mfumo wa wastani-tofauti wa Markowitz. Lengo ni kupata vekta ya uzito $w$ ambayo inatatua moja ya matatizo mawili:
Uwiano wa Juu zaidi wa Sharpe:
$\max_{w} \frac{w^T \mu}{\sqrt{w^T \Sigma w}}$
chini ya masharti $\sum_i w_i = 1$, na uwezekano $w_i \ge 0$ kwa kutokuwepo kwa mauzo mafupi.
Tofauti ya Chini kabisa kwa Mapato ya Lengo $R_p$:
$\min_{w} w^T \Sigma w$
chini ya masharti $w^T \mu = R_p$ na $\sum_i w_i = 1$.
Ambapo $\mu$ ni vekta ya mapato yanayotarajiwa (yaliyotabiriwa na RF/XGBoost) na $\Sigma$ ni matriki ya ushirikiano ya mapato. Miundo ya mkusanyiko wa miti yenyewe hufanya kazi kwa kuunda seti ya miti $M$ (kwa Msitu wa Nasibu) au miti iliyojengwa kwa mpangilio (kwa XGBoost) ambayo inaweka ramani ya vipengele vya pembejeo $x$ kwa mapato yaliyotabiriwa $\hat{y}$. Kwa Msitu wa Nasibu, utabiri ni wastani: $\hat{y} = \frac{1}{M} \sum_{m=1}^{M} T_m(x)$. Utabiri wa XGBoost ni mfumo wa nyongeza: $\hat{y} = \sum_{k=1}^{K} f_k(x)$, ambapo kila $f_k$ ni mti kutoka kwa nafasi ya kazi $\mathcal{F}$, na mfano hufunzwa kwa kupunguza lengo lililosawazishwa: $\mathcal{L}(\phi) = \sum_i l(\hat{y}_i, y_i) + \sum_k \Omega(f_k)$, na $\Omega(f) = \gamma T + \frac{1}{2}\lambda ||w||^2$ ikidhibiti utata.
6. Mfumo wa Uchambuzi: Kesi ya Mfano
Hali: Mfuko wa uwekezaji unataka kugawa kati ya hisa za Marekani (zinazowakilishwa na ETF ya SPY) na kiwango cha ubadilishaji wa GBP/USD (kinachowakilishwa na nafasi ya forex) kwa robo mwaka inayofuata.
Hatua ya 1 - Utayarishaji wa Data: Kukusanya data ya miezi 10 iliyopita ya mapato ya SPY, mapato ya GBP/USD, na vigezo 20 vya uchumi (k.m., CPI ya Marekani, CPI ya Uingereza, Kiwango cha Fed Funds, Kiwango cha BoE, tofauti ya mavuno ya miaka 10 ya Marekani-Uingereza, VIX, n.k.). Kigezo cha lengo ni mapato ya kipindi kijacho. Miaka 2 iliyopita zaidi inahifadhiwa kama seti ya majaribio.
Hatua ya 2 - Mafunzo ya Mfano & Utabiri: Funza mfano wa XGBoost kwenye data ya mafunzo ili kutabiri mapato ya SPY na mfano tofauti kwa mapato ya GBP/USD. Tumia urekebishaji wa vigezo vya juu (kupitia uthibitishaji wa msalaba) kwa vigezo kama `max_depth`, `learning_rate`, na `n_estimators`. Toa utabiri wa hatua moja mbele kwa kipindi cha majaribio.
Hatua ya 3 - Uboreshaji wa Mfuko: Kwa kila mwezi katika seti ya majaribio, tumia utabiri wa XGBoost kama $\mu$ na mapato ya kihistoria ya miaka 3 iliyopita ili kuhesabu matriki ya ushirikiano $\Sigma$. Tatua uzito wa mfuko wa tangency (uwiano wa juu zaidi wa Sharpe).
Hatua ya 4 - Jaribio la Nyuma & Tathmini: Hesabu mapato ya jumla, mabadiliko, na uwiano wa Sharpe wa mfuko wa msingi wa ML uliorekebishwa tena kwa nguvu. Linganisha na mfuko wa tuli wa 60/40 na mfuko unaotumia wastani wa kihistoria wa mapato kwa $\mu$.
7. Matumizi ya Baadaye & Mwelekeo wa Utafiti
- Mifuko ya Mali Nyingi: Kupanua mfumo huu kwa ulimwengu mpana zaidi wa mali (dhamana, bidhaa, hisa za kimataifa) ili kujaribu nguvu ya kweli ya utofautishaji ya ML.
- Makadirio ya Ushirikiano wa Nguvu: Kuunganisha mbinu za ML (k.m., Graphical LASSO, RNNs) kutabiri matriki ya ushirikiano $\Sigma$ pamoja na mapato, na hivyo kuondoka kwenye makadirio ya kihistoria.
- Kujumuisha Data Mbadala: Kuboresha seti za vipengele kwa data ya hisia kutoka kwa habari/jamii ya mitandao, taarifa za mnyororo wa usambazaji, au picha za satelaiti, kama ilivyochunguzwa katika masomo kama "Athari ya Habari kwenye Mabadiliko" (Tetlock, 2007).
- Kujifunza Mtandaoni & Kukabiliana: Kutekeleza toleo la mtandaoni la mkusanyiko wa miti ambao unaweza kukabiliana na mabadiliko ya hali ya soko kwa wakati halisi, dhana inayolingana na changamoto za "kujifunza endelevu" katika AI.
- Ujumuishaji wa AI Inayoweza Kufafanuliwa (XAI): Kutumia thamani za SHAP (SHapley Additive exPlanations) pamoja na umuhimu wa kipengele ili kutoa maelezo ya kina, ya kiwango cha mfano kwa nini utabiri fulani ulifanywa, jambo muhimu kwa imani ya wadau katika fedha.
- Ujumuishaji wa Sababu: Kuchanganya utabiri wa ML na miundo ya kitamaduni ya sababu (k.m., sababu za Fama-French) ili kuunda makadirio ya mseto ya mapato yanayotarajiwa.
8. Marejeo
- Ahmed, N. K., Atiya, A. F., Gayar, N. E., & El-Shishiny, H. (2010). An empirical comparison of machine learning models for time series forecasting. Econometric Reviews, 29(5-6), 594-621.
- Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5-32.
- Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 785-794.
- Markowitz, H. (1952). Portfolio selection. The Journal of Finance, 7(1), 77-91.
- Pham, H. (2025). [Kazi inayohusika kwenye mikakati ya hisa/dhamana iliyotajwa kwenye PDF].
- Ţiţan, A. G. (2015). The efficient market hypothesis: Review of specialized literature and empirical research. Procedia Economics and Finance, 32, 442-449.
- Zhu, J. Y., Park, T., Isola, P., & Efros, A. A. (2017). Unpaired image-to-image translation using cycle-consistent adversarial networks. Proceedings of the IEEE International Conference on Computer Vision, 2223-2232. (Imetajwa kama mfano wa karatasi ya msingi ya usanifu wa ML kwa marejeo ya dhana).