Métodos de Conjuntos de Árboles para la Optimización de Carteras de Dos Activos: Un Estudio de Caso de Aprendizaje Automático

Tabla de Contenidos

1. Introducción

Este estudio aborda el desafío de construir una cartera de inversión óptima de dos activos utilizando técnicas de aprendizaje automático. La investigación se centra en una cartera compuesta por el índice bursátil S&P 500 y el par de divisas USD/GBP. El objetivo principal es aprovechar datos macroeconómicos con frecuencias mensuales y trimestrales para pronosticar los rendimientos de estos activos utilizando métodos de conjuntos de árboles, específicamente Random Forest y XGBoost. Estos pronósticos se utilizan luego como entradas de rendimiento esperado para la optimización de la teoría moderna de carteras (MPT). Un objetivo secundario es identificar qué variables macroeconómicas ejercen una influencia significativa en los pronósticos. El estudio examina críticamente si una cartera construida con datos estimados por ML difiere significativamente de una construida utilizando promedios históricos simples.

2. Metodología y Datos

2.1 Recopilación y Preprocesamiento de Datos

El análisis utiliza series temporales para el índice S&P 500 y el tipo de cambio USD/GBP. Se recopila un conjunto de indicadores macroeconómicos como características predictivas potenciales, que pueden incluir variables como tasas de interés, índices de inflación, cifras de producción industrial y tasas de desempleo, obtenidas de bases de datos como FRED. Los datos se dividen en conjuntos de entrenamiento, validación y prueba, prestando especial atención a evitar el sesgo de mirada hacia adelante. Las características se normalizan o estandarizan según lo requieran los modelos.

2.2 Modelos de Conjunto de Árboles: Random Forest y XGBoost

Se emplean dos algoritmos avanzados de aprendizaje por conjuntos para el pronóstico de series temporales:

Random Forest: Un conjunto de árboles de decisión entrenados en muestras bootstrap de los datos con selección aleatoria de características, reduciendo el sobreajuste y proporcionando predicciones robustas.
XGBoost (Extreme Gradient Boosting): Un marco de boosting de gradiente escalable y regularizado, conocido por su velocidad y rendimiento. Construye árboles secuencialmente para corregir los errores de los anteriores, ofreciendo a menudo resultados de vanguardia en datos estructurados.

Estos modelos se eligen por su capacidad para manejar relaciones no lineales e interacciones complejas entre variables macroeconómicas sin suposiciones paramétricas estrictas.

2.3 Marco de Construcción de Carteras

Los rendimientos pronosticados por los modelos de ML sirven como el vector de rendimiento esperado $\mu$ en el marco de optimización media-varianza de Markowitz. Los pesos de la cartera $w$ para los dos activos se determinan resolviendo el problema de optimización que maximiza el ratio de Sharpe o minimiza la varianza para un rendimiento objetivo. La matriz de covarianza $\Sigma$ se estima típicamente a partir de los rendimientos históricos. Luego, el rendimiento de la "cartera basada en ML" se compara con el de una cartera de referencia construida utilizando promedios históricos de rendimiento.

3. Resultados Experimentales y Análisis

3.1 Rendimiento de Pronóstico

Los modelos de conjuntos de árboles demostraron una capacidad estadísticamente significativa para pronosticar el movimiento direccional y, en menor medida, la magnitud de los rendimientos tanto para el S&P 500 como para el USD/GBP. Se reportaron métricas de evaluación como el Error Absoluto Medio (MAE), la Raíz del Error Cuadrático Medio (RMSE) y la precisión direccional. XGBoost a menudo mostró una ligera ventaja sobre Random Forest en términos de precisión predictiva, particularmente en los datos trimestrales, probablemente debido a su mecanismo de boosting más sofisticado y a la regularización.

3.2 Comparación del Rendimiento de la Cartera

Descripción del Gráfico: Un gráfico de líneas comparativo mostraría los rendimientos acumulados de tres carteras durante el período de prueba fuera de la muestra: 1) La cartera óptima basada en pronósticos de ML, 2) La cartera óptima basada en promedios históricos, y 3) Una referencia con ponderación equitativa.

Los resultados indicaron que la cartera construida utilizando pronósticos de ML logró un perfil de rendimiento ajustado al riesgo superior (ratio de Sharpe más alto) en comparación con la cartera basada en promedios históricos. Los pesos de asignación de activos entre el S&P 500 y el USD/GBP también difirieron significativamente, lo que sugiere que los modelos de ML capturaron rendimientos esperados variables en el tiempo que los promedios históricos simples no pudieron.

3.3 Análisis de Importancia de Características

Tanto Random Forest como XGBoost proporcionan puntuaciones nativas de importancia de características. El análisis reveló que, para el S&P 500, indicadores líderes como los diferenciales de tipos de interés, el sentimiento del consumidor y la volatilidad previa del mercado de valores estuvieron entre los principales predictores. Para el USD/GBP, los diferenciales de tasas de interés, los datos de balanza comercial y los movimientos más amplios del índice del dólar fueron los más influyentes. Esta información es valiosa para la interpretación económica y la simplificación del modelo.

4. Ideas Clave y Discusión

Idea Central

El argumento más convincente del artículo no es que el ML pueda vencer al mercado, sino que incluso mejoras modestas y explicables en el pronóstico mediante conjuntos de árboles pueden alterar materialmente los cálculos de la frontera eficiente para una cartera simple de dos activos. Esto desafía el dogma de asignación pasiva "configurar y olvidar" para inversores a largo plazo en mezclas que no sean solo acciones/bonos.

Flujo Lógico

La lógica de la investigación es sólida: 1) Usar ML robusto y no paramétrico (RF/XGBoost) para digerir datos macro en pronósticos de rendimiento, evitando las trampas de los modelos lineales. 2) Alimentar estos pronósticos en el motor clásico de Markowitz. 3) Validar que la cartera resultante difiere de una referencia histórica ingenua. El flujo desde los impulsores macro hasta los pronósticos de activos y luego a los pesos de la cartera es claro y replicable.

Fortalezas y Debilidades

Fortalezas: El enfoque pragmático en un caso manejable de dos activos mejora la claridad. El uso de modelos de árboles proporciona no linealidad inherente e importancia de características, añadiendo interpretabilidad económica que a menudo falta en los artículos de finanzas con aprendizaje profundo. La comparación con una línea de base de promedio histórico es justa y relevante.

Debilidades: El elefante en la habitación es la estimación de la covarianza. El estudio utiliza covarianza histórica, que es notoriamente inestable. Una estructura de covarianza pronosticada por ML podría ser un próximo paso lógico, pero está ausente. La simplificación de dos activos, si bien es una fortaleza para la claridad, limita los beneficios de diversificación que el ML podría desbloquear en un contexto multi-activo. Los costos de transacción y la viabilidad práctica del rebalanceo mensual/trimestral basado en estas señales no se abordan.

Ideas Accionables

Para los profesionales: No pasen por alto métodos de conjunto simples como XGBoost para el pronóstico de rendimientos; pueden ser más robustos e interpretables que las redes neuronales para datos macro/financieros estructurados. Los impulsores macro clave identificados (por ejemplo, diferenciales de tipos para acciones, diferenciales de tasas para divisas) deben estar en la mente de los analistas que monitorean estas clases de activos. Este enfoque es más justificable para inversores institucionales o individuos sofisticados que puedan implementar y rebalancear sistemáticamente dicha estrategia, no para traders minoristas que buscan alfa a corto plazo.

5. Detalles Técnicos y Marco Matemático

El núcleo de la optimización de carteras es el modelo media-varianza de Markowitz. El objetivo es encontrar el vector de pesos $w$ que resuelva uno de dos problemas:

Máximo Ratio de Sharpe:
$\max_{w} \frac{w^T \mu}{\sqrt{w^T \Sigma w}}$
sujeto a $\sum_i w_i = 1$, y potencialmente $w_i \ge 0$ para evitar ventas en corto.

Varianza Mínima para un Rendimiento Objetivo $R_p$:
$\min_{w} w^T \Sigma w$
sujeto a $w^T \mu = R_p$ y $\sum_i w_i = 1$.

Donde $\mu$ es el vector de rendimientos esperados (pronosticados por RF/XGBoost) y $\Sigma$ es la matriz de covarianza de los rendimientos. Los modelos de conjuntos de árboles funcionan creando un conjunto de $M$ árboles (para Random Forest) o árboles construidos secuencialmente (para XGBoost) que mapean las características de entrada $x$ a un rendimiento pronosticado $\hat{y}$. Para un Random Forest, la predicción es un promedio: $\hat{y} = \frac{1}{M} \sum_{m=1}^{M} T_m(x)$. La predicción de XGBoost es un modelo aditivo: $\hat{y} = \sum_{k=1}^{K} f_k(x)$, donde cada $f_k$ es un árbol del espacio funcional $\mathcal{F}$, y el modelo se entrena minimizando un objetivo regularizado: $\mathcal{L}(\phi) = \sum_i l(\hat{y}_i, y_i) + \sum_k \Omega(f_k)$, con $\Omega(f) = \gamma T + \frac{1}{2}\lambda ||w||^2$ controlando la complejidad.

6. Marco de Análisis: Caso de Ejemplo

Escenario: Un fondo de inversión quiere asignar entre acciones estadounidenses (representadas por el ETF SPY) y el tipo de cambio GBP/USD (representado por una posición en forex) para el próximo trimestre.

Paso 1 - Preparación de Datos: Recopilar los últimos 10 años de datos mensuales para los rendimientos de SPY, los rendimientos de GBP/USD y 20 variables macroeconómicas (por ejemplo, IPC de EE. UU., IPC del Reino Unido, Tasa de Fondos Federales, Tasa del BoE, diferencial de rendimiento a 10 años EE. UU.-Reino Unido, VIX, etc.). La variable objetivo es el rendimiento del próximo período. Los 2 años más recientes se reservan como conjunto de prueba.

Paso 2 - Entrenamiento del Modelo y Pronóstico: Entrenar un modelo XGBoost en los datos de entrenamiento para predecir los rendimientos de SPY y un modelo separado para los rendimientos de GBP/USD. Usar ajuste de hiperparámetros (mediante validación cruzada) para parámetros como `max_depth`, `learning_rate` y `n_estimators`. Generar pronósticos de un paso adelante para el período de prueba.

Paso 3 - Optimización de la Cartera: Para cada mes en el conjunto de prueba, usar el pronóstico de XGBoost como $\mu$ y los rendimientos históricos de los últimos 3 años para calcular la matriz de covarianza $\Sigma$. Resolver para los pesos de la cartera de tangencia (máximo ratio de Sharpe).

Paso 4 - Prueba Retrospectiva y Evaluación: Calcular el rendimiento acumulado, la volatilidad y el ratio de Sharpe de la cartera basada en ML rebalanceada dinámicamente. Compararla con una cartera estática 60/40 y una cartera que utiliza promedios históricos de rendimiento para $\mu$.

7. Aplicaciones Futuras y Direcciones de Investigación

Carteras Multi-Activo: Extender el marco a un universo más amplio de activos (bonos, materias primas, acciones internacionales) para probar el verdadero poder de diversificación del ML.
Estimación Dinámica de Covarianza: Integrar técnicas de ML (por ejemplo, Graphical LASSO, RNNs) para pronosticar la matriz de covarianza $\Sigma$ junto con los rendimientos, avanzando más allá de la estimación histórica.
Incorporación de Datos Alternativos: Mejorar los conjuntos de características con datos de sentimiento de noticias/redes sociales, información de la cadena de suministro o imágenes satelitales, como se explora en estudios como "El Impacto de las Noticias en la Volatilidad" (Tetlock, 2007).
Aprendizaje en Línea y Adaptación: Implementar versiones en línea de conjuntos de árboles que puedan adaptarse a regímenes de mercado cambiantes en tiempo real, un concepto alineado con los desafíos del "aprendizaje continuo" en IA.
Integración de IA Explicable (XAI): Usar valores SHAP (SHapley Additive exPlanations) junto con la importancia de características para proporcionar explicaciones más profundas a nivel de instancia de por qué se hizo un pronóstico determinado, crucial para la confianza de las partes interesadas en finanzas.
Integración de Factores: Combinar pronósticos de ML con modelos factoriales tradicionales (por ejemplo, factores de Fama-French) para crear estimaciones híbridas de rendimiento esperado.

8. Referencias

Ahmed, N. K., Atiya, A. F., Gayar, N. E., & El-Shishiny, H. (2010). An empirical comparison of machine learning models for time series forecasting. Econometric Reviews, 29(5-6), 594-621.
Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5-32.
Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 785-794.
Markowitz, H. (1952). Portfolio selection. The Journal of Finance, 7(1), 77-91.
Pham, H. (2025). [Trabajo relevante sobre estrategias de acciones/bonos citado en el PDF].
Ţiţan, A. G. (2015). The efficient market hypothesis: Review of specialized literature and empirical research. Procedia Economics and Finance, 32, 442-449.
Zhu, J. Y., Park, T., Isola, P., & Efros, A. A. (2017). Unpaired image-to-image translation using cycle-consistent adversarial networks. Proceedings of the IEEE International Conference on Computer Vision, 2223-2232. (Citado como ejemplo de un artículo seminal de arquitectura de ML para referencia conceptual).