1. Introduction
Cet article présente un cadre de Dynamique Entropique pour modéliser la dynamique des taux de change (Forex) et évaluer les options européennes. L'objectif principal est de fournir une fondation alternative, basée sur la théorie de l'information, aux approches traditionnelles du calcul stochastique. Les auteurs, Mohammad Abedi et Daniel Bartolomeo de l'Université d'Albany-SUNY, s'appuient sur les principes de l'inférence entropique et de l'entropie maximale pour traiter les situations d'information incomplète – une réalité courante sur les marchés financiers. Le cadre intègre systématiquement des symétries connues, comme l'invariance d'échelle, conduisant à la dérivation de modèles établis tels que le Mouvement Brownien Géométrique (MBG) et le modèle de Garman-Kohlhagen à partir de principes premiers.
2. Cadre Théorique
La méthodologie repose sur trois piliers de l'inférence entropique.
2.1. Fondements de l'Inférence Entropique
L'inférence entropique est un cadre inductif conçu pour raisonner sous incertitude. Elle étend la logique classique pour gérer l'information partielle. Les distributions de probabilité représentent l'état de connaissance d'un système.
2.2. Principe de Mise à Jour Minimale
Lorsque de nouvelles informations deviennent disponibles, la distribution de probabilité antérieure est mise à jour en utilisant l'entropie relative (divergence de Kullback-Leibler). La mise à jour est régie par le Principe de Mise à Jour Minimale, qui garantit que les changements ne sont effectués que si les nouvelles données l'exigent, produisant la distribution postérieure la moins biaisée.
2.3. Géométrie de l'Information
L'espace des distributions de probabilité forme une variété riemannienne avec une métrique unique dérivée de l'information de Fisher. Cette géométrie de l'information fournit une notion de distance entre les distributions, ce qui est crucial pour définir la dynamique. Les auteurs notent son importance potentielle pour l'optimisation de portefeuille, à explorer dans des travaux futurs.
3. Dynamique Entropique pour les Taux de Change
La Dynamique Entropique applique le cadre d'inférence pour modéliser l'évolution des systèmes, introduisant un temps entropique spécifique au système.
3.1. Invariance d'Échelle et Sélection de Variable
Une symétrie clé sur les marchés des changes est l'invariance d'échelle : la dynamique doit être invariante sous des transformations comme $S \rightarrow \lambda S$, où $S$ est le taux de change. Pour rendre cette symétrie manifeste, les auteurs identifient $x = \log S$ comme la variable naturelle à modéliser, car la transformation devient une translation $x \rightarrow x + \log \lambda$.
3.2. Dérivation du Mouvement Brownien Géométrique
En imposant des contraintes basées sur les informations disponibles concernant le taux de change (par exemple, sa dérive et sa volatilité attendues) et en maximisant l'entropie relative sous ces contraintes, le cadre conduit naturellement à une dynamique pour $x$. Le retour à $S$ donne l'équation du Mouvement Brownien Géométrique (MBG) : $$ dS_t = \mu S_t dt + \sigma S_t dW_t $$ où $\mu$ est la dérive, $\sigma$ est la volatilité, et $W_t$ est un processus de Wiener. Cette dérivation montre que le MBG émerge comme le modèle le moins biaisé compatible avec les contraintes de moments données et la symétrie d'échelle.
4. Cadre d'Évaluation des Options
Pour évaluer les produits dérivés, un cadre d'évaluation neutre au risque est essentiel pour éviter l'arbitrage.
4.1. Dérivation de la Mesure Neutre au Risque
Dans le cadre entropique, le passage de la mesure du monde réel $\mathbb{P}$ à une mesure neutre au risque $\mathbb{Q}$ est interprété comme un problème d'inférence. Il s'agit de mettre à jour l'antérieur (la dynamique du monde réel) avec la nouvelle information que le prix actualisé de l'actif doit être une martingale (pas d'arbitrage). L'application du Principe de Mise à Jour Minimale sous cette contrainte conduit à la transformation du théorème de Girsanov, définissant $\mathbb{Q}$.
4.2. Modèle de Garman-Kohlhagen
L'application de la mesure neutre au risque à la dynamique MBG pour un taux de change (qui implique deux taux d'intérêt, domestique $r_d$ et étranger $r_f$) et la résolution de l'EDP de Black-Scholes-Merton pour une option européenne donne la formule de Garman-Kohlhagen : $$ C = S_0 e^{-r_f T} \Phi(d_1) - K e^{-r_d T} \Phi(d_2) $$ où $$ d_1 = \frac{ (S_0/K) + (r_d - r_f + \sigma^2/2)T}{ \sigma\sqrt{T}}, \quad d_2 = d_1 - \sigma\sqrt{T}. $$ Ce résultat aligne l'approche de dynamique entropique avec le modèle standard d'évaluation des options de change.
5. Analyse Technique & Idées Clés
Idée Clé : Cet article n'est pas simplement une autre dérivation de Black-Scholes ; c'est un coup de force philosophique. Il soutient que tout l'édifice de la finance en temps continu – du MBG à l'évaluation neutre au risque – n'est pas seulement une astuce mathématique pratique, mais la conséquence inévitable de l'application de la logique la plus conservatrice (entropie maximale) à une information incomplète sous des symétries spécifiques. Les auteurs disent essentiellement : « Si vous acceptez ces axiomes sur la manière de raisonner sous incertitude, les modèles que vous utilisez vous sont imposés. »
Flux Logique : L'argument est élégant et implacable : 1) Axiome : Utiliser la probabilité pour quantifier la croyance et la mettre à jour de manière minimale quand de nouvelles informations arrivent (MaxEnt). 2) Contrainte : Les taux de change ont une symétrie d'échelle. 3) Dérivation : Le MBG apparaît. 4) Nouvelle Contrainte : Pas d'arbitrage. 5) Dérivation : La mesure neutre au risque et Garman-Kohlhagen apparaissent. Le flux des principes premiers à la formule standard de l'industrie est clair et convaincant.
Forces & Faiblesses : La force est la clarté fondamentale. Elle démystifie la « magie » de l'évaluation neutre au risque en la présentant comme une étape d'inférence logique. Cependant, la faiblesse est sa propre prémisse : elle dérive un modèle vieux de 50 ans. Le monde réel a une volatilité stochastique, des sauts et des crises de liquidité – des phénomènes que cette dérivation immaculée efface. Comme noté dans le travail séminal de Cont (2001) sur les limites des modèles, les échecs empiriques du MBG sont bien documentés. Ce cadre, dans sa forme actuelle, est plus apte à justifier le passé qu'à guider l'avenir. C'est une réponse brillante à une question que beaucoup de quants ont cessé de se poser.
Perspectives Actionnables : Pour les praticiens, le bénéfice immédiat est limité – vous ne coderez pas un meilleur moteur de pricing à partir de ceci. La vraie valeur est stratégique : 1) Gouvernance des Modèles : Utilisez ceci comme référence pour expliquer pourquoi vous utilisez des modèles standard, satisfaisant les comités de validation. 2) Direction de la Recherche : Le véritable potentiel réside dans la voie non empruntée. L'article évoque l'utilisation de la géométrie de l'information pour la théorie du portefeuille. C'est la mine d'or. Au lieu de dériver d'anciens résultats, les travaux futurs devraient utiliser les outils de ce cadre – comme la métrique de Fisher – pour mesurer la « distance informationnelle » entre régimes de marché ou pour construire des dynamiques qui respectent intrinsèquement des contraintes plus complexes (par exemple, le comportement des queues), dépassant ainsi le carcan du MBG.
6. Analyse Originale : Une Perspective Critique
L'article d'Abedi et Bartolomeo présente un exercice intellectuel convaincant pour recadrer les mathématiques financières classiques à travers le prisme de la théorie de l'information. Sa contribution principale n'est pas un nouveau modèle, mais une dérivation et une justification nouvelles pour des modèles existants – le Mouvement Brownien Géométrique (MBG) et le modèle de Garman-Kohlhagen. Cela s'inscrit dans une tendance plus large en finance quantitative cherchant des principes plus fondamentaux, rappelant l'approche axiomatique en économie ou la recherche de principes premiers en physique.
Techniquement, l'application des principes d'entropie maximale pour dériver la dynamique est élégante. L'identification de $\log S$ comme la variable correcte en raison de l'invariance d'échelle est une étape cruciale et bien justifiée. Elle fait écho à l'utilisation des prix logarithmiques dans pratiquement tous les modèles de volatilité stochastique et de diffusion avec sauts qui ont succédé au MBG. Cependant, le résultat du cadre – le MBG standard – est sa plus grande limitation. La littérature financière depuis le krach de 1987 et la crise de 2008 a démontré de manière écrasante les lacunes empiriques du MBG : il ne parvient pas à capturer le clustering de volatilité (comme dans les modèles GARCH), les rendements à queues épaisses et le sourire/le skew de volatilité omniprésents sur les marchés d'options. Des modèles comme celui de Heston (1993) ou les processus de Lévy à activité infinie passés en revue par Cont et Tankov (2004) ont été développés précisément pour combler ces lacunes.
Par conséquent, la signification de l'article ne réside pas dans ses équations finales mais dans sa promesse méthodologique. Le cadre d'inférence entropique est intrinsèquement flexible. Les contraintes utilisées pour dériver le MBG (moyenne et variance des rendements) sont simplistes. Le vrai test serait d'imposer des contraintes plus réalistes – telles que la volatilité de la volatilité observée ou certains moments de la distribution des rendements – et de voir quelle dynamique émerge. Pourrait-il dériver un modèle de type Heston ? Ce serait une contribution bien plus impactante. La référence à des travaux futurs sur la géométrie de l'information pour l'optimisation de portefeuille est particulièrement alléchante. La métrique d'information de Fisher pourrait fournir un moyen rigoureux de mesurer la stabilité ou la sensibilité d'un portefeuille aux erreurs d'estimation des paramètres, un sujet de grande préoccupation pratique souvent traité de manière heuristique.
En conclusion, ce travail est une preuve de concept sophistiquée. Il transplante avec succès le cadre de dynamique entropique de la physique à la finance et montre qu'il peut reproduire des résultats fondamentaux. Sa valeur sera déterminée par la capacité des recherches ultérieures à exploiter la machinerie de ce cadre pour s'attaquer aux déficiences connues de ces fondements mêmes, passant d'une justification élégante à une véritable innovation.
7. Cadre Mathématique & Détails Techniques
Le moteur mathématique central est la maximisation de l'entropie relative (divergence de Kullback-Leibler) sous contraintes. Étant donné une distribution antérieure $q(x)$ et de nouvelles informations sous forme de valeurs attendues $\mathbb{E}_p[f_i(x)] = F_i$ pour plusieurs fonctions $f_i$, la postérieure $p(x)$ est trouvée en minimisant : $$ D_{KL}[p||q] = \int p(x) \ln \frac{p(x)}{q(x)} dx $$ sous les contraintes $\int p(x) f_i(x) dx = F_i$ et la normalisation $\int p(x) dx = 1$. En utilisant des multiplicateurs de Lagrange $\lambda_i$, la solution est : $$ p(x) = \frac{1}{Z} q(x) \exp\left(-\sum_i \lambda_i f_i(x)\right) $$ où $Z$ est la fonction de partition. Dans le contexte de la dynamique, $q(x)$ représente la probabilité d'une transition depuis un état initial, et les contraintes encodent la dérive et la fluctuation attendues du système. Pour l'application Forex, avec $x = \log S$, une contrainte sur le changement attendu $\mathbb{E}[\Delta x]$ et sa variance $\mathbb{E}[(\Delta x)^2]$ conduit à une probabilité de transition gaussienne, qui à la limite continue produit l'équation de diffusion sous-jacente au MBG.
Le passage à la mesure neutre au risque $\mathbb{Q}$ implique d'ajouter une nouvelle contrainte : le rendement attendu de l'actif actualisé doit être égal au taux sans risque. Cela modifie les multiplicateurs de Lagrange, introduisant effectivement un terme d'ajustement de dérive $\theta$ tel que $dW^{\mathbb{Q}}_t = dW^{\mathbb{P}}_t + \theta dt$, ce qui est l'essence du théorème de Girsanov.
8. Cadre Analytique & Exemple de Cas
Cas : Justification du Choix de Modèle pour une Parité de Devises (EUR/USD)
Scénario : Un analyste quantitatif dans une banque est chargé de développer un modèle pour évaluer les options vanilles EUR/USD. Il doit justifier son choix de modèle auprès du comité de validation des modèles.
Application du Cadre Entropique :
- Énoncer l'Information Antérieure : L'analyste liste les faits connus : EUR/USD est positif, ses variations en pourcentage sont plus pertinentes que les variations absolues (invariance d'échelle), et les données historiques fournissent des estimations pour la dérive moyenne et la volatilité.
- Appliquer le Principe de Mise à Jour Minimale : Partant d'un état d'ignorance maximale (un antérieur plat pour $\log S$), l'analyste met à jour ses croyances en incorporant les contraintes de dérive et de volatilité via l'entropie maximale.
- Dériver la Dynamique : Le cadre produit le MBG comme le modèle le moins biaisé compatible avec les deux contraintes de moments. L'analyste présente cette dérivation au comité, arguant que l'utilisation d'un modèle avec plus de paramètres (par exemple, volatilité stochastique) nécessiterait des informations supplémentaires, statistiquement robustes, pour justifier la mise à jour plus complexe.
- Évaluation : Pour évaluer les options, l'analyste ajoute la contrainte de non-arbitrage, dérivant la mesure neutre au risque et la formule de Garman-Kohlhagen.
Résultat : Le comité accepte le MBG/Garman-Kohlhagen comme modèle de référence en raison de sa dérivation fondée sur des principes à partir d'une information limitée. Il peut approuver un modèle plus complexe (comme SABR) pour des échéances/parités spécifiques seulement si l'analyste peut démontrer, peut-être en utilisant la même logique entropique, que des données de marché supplémentaires (par exemple, le sourire de volatilité) fournissent suffisamment d'informations pour justifier la mise à jour plus complexe à partir de l'antérieur MBG.
9. Applications Futures & Directions de Recherche
Le cadre de dynamique entropique ouvre plusieurs voies prometteuses au-delà de la reproduction des résultats classiques :
- Au-delà du MBG : L'incorporation de contraintes sur des moments d'ordre supérieur (asymétrie, aplatissement) ou sur le processus de volatilité lui-même pourrait conduire à des dérivations basées sur l'entropie de modèles de volatilité locale/stochastique ou de diffusion avec sauts.
- Géométrie de l'Information dans la Construction de Portefeuille : Comme évoqué par les auteurs, la métrique de Fisher peut quantifier la « distance statistique » entre différents environnements de marché. Cela pourrait être utilisé pour : 1) Développer des stratégies de portefeuille robustes qui minimisent la sensibilité aux erreurs dans les paramètres estimés. 2) Créer des signaux d'alerte précoce pour les changements de régime en surveillant la distance informationnelle entre les rendements récents et le modèle actuel.
- Modélisation d'Actifs Illiquides : Pour les actifs avec des données éparses, l'approche d'entropie maximale fournit une méthode rigoureuse pour spécifier une distribution antérieure basée sur des principes économiques ou des actifs similaires, et la mettre à jour de manière minimale à mesure que de nouvelles transactions se produisent.
- Dynamique Multi-Actifs : Étendre le cadre à plusieurs actifs corrélés. Les contraintes incluraient les corrélations, et la dynamique résultante respecterait naturellement la géométrie de la structure de covariance, offrant potentiellement des insights sur le risque systémique.
- Intégration avec l'Apprentissage Automatique : Le paradigme de « mise à jour de l'antérieur » s'aligne avec l'apprentissage automatique bayésien. Le cadre pourrait guider la conception de réseaux de neurones qui incorporent des contraintes financières (comme la non-arbitrage) directement dans leur architecture ou leurs fonctions de perte, améliorant l'interprétabilité et la robustesse.
10. Références
- Jaynes, E. T. (1957). Information Theory and Statistical Mechanics. Physical Review, 106(4), 620–630.
- Caticha, A. (2012). Entropic Inference and the Foundations of Physics. In 11th Brazilian Meeting on Bayesian Statistics.
- Garman, M. B., & Kohlhagen, S. W. (1983). Foreign currency option values. Journal of International Money and Finance, 2(3), 231–237.
- Black, F., & Scholes, M. (1973). The pricing of options and corporate liabilities. Journal of Political Economy, 81(3), 637–654.
- Cont, R. (2001). Empirical properties of asset returns: stylized facts and statistical issues. Quantitative Finance, 1(2), 223–236.
- Heston, S. L. (1993). A closed-form solution for options with stochastic volatility with applications to bond and currency options. The Review of Financial Studies, 6(2), 327–343.
- Cont, R., & Tankov, P. (2004). Financial Modelling with Jump Processes. Chapman and Hall/CRC.
- Amari, S. I., & Nagaoka, H. (2000). Methods of Information Geometry. American Mathematical Society.