匯率與選擇權的熵動態：一個外匯建模的新框架

1. 引言

本文提出一個熵動態框架，用於建模外匯匯率並為歐式選擇權定價。核心目標是為金融動態學提供一個替代性的、基於資訊理論的基礎，超越傳統的隨機微積分。作者 Mohammad Abedi 和 Daniel Bartolomeo 利用熵推論的原則——一種在不完整資訊下進行推理的方法——從第一性原理推導出眾所周知的金融模型。

這項工作將最大熵和資訊幾何等抽象概念與實務金融連結起來，最終推導出匯率的幾何布朗運動以及外匯選擇權的Garman-Kohlhagen 模型。此方法突顯了貨幣對內在的尺度不變性對稱性，從而自然地選擇對匯率的對數進行建模。

2. 理論框架

2.1. 熵推論與最大熵

熵推論是針對資訊不完整情況的歸納框架。其第一個工具是機率論，用於表示信念狀態。第二個是相對熵（或稱 Kullback-Leibler 散度），在最小更新原則的指導下，用於在新資訊到來時更新信念。最大化相對熵可得到包含所有可用資訊、偏見最小的後驗分佈。

第三個工具是資訊幾何，它為機率分佈空間提供了一種度量。雖然本文未深入探討，但作者指出其在投資組合管理和多資產動態學方面的潛在重要性。

2.2. 熵動態與時間

熵動態應用熵推論來建模系統的變化方式。一個關鍵創新是引入了熵時間參數，該參數是湧現的，並針對特定系統量身定制，而非一個通用時鐘。此概念已成功應用於多個物理學領域，並在此適應於金融領域。

2.3. 外匯中的尺度不變性

外匯市場的一個基本對稱性是尺度不變性：動態學不應取決於我們是以 USD/EUR 還是其倒數形式報價匯率。這種對稱性要求模型應以匯率的對數 $x = \ln S$ 來表述，其中 $S$ 是即期外匯匯率。當以 $x$ 表示時，像 $S \to \lambda S$（簡單縮放）這樣的變換會使動態學保持不變。

3. 模型推導

3.1. 從熵原理到幾何布朗運動

從關於外匯匯率的先驗資訊（特別是初始值和波動率）出發，作者使用熵動態框架推導其時間演化。通過施加與市場觀察一致的約束（如有限變異數）並最大化熵，結果顯示未來對數匯率 $x$ 的機率分佈遵循一個漂移-擴散過程。

轉換回即期匯率 $S = e^x$，此過程就變為熟悉的幾何布朗運動： $$ dS_t = \mu S_t dt + \sigma S_t dW_t $$ 其中 $\mu$ 是漂移率，$\sigma$ 是波動率，$W_t$ 是維納過程。此推導明確地尊重了尺度不變性。

3.2. 風險中性測度與選擇權定價

為了對衍生性商品定價，需要援引無套利原則。作者展示了如何在熵框架內推導出風險中性測度 $\mathbb{Q}$。這涉及將 GBM 過程的漂移率調整為兩種貨幣之間的無風險利率差 $(r_d - r_f)$。

在 $\mathbb{Q}$ 測度下，動態學變為： $$ dS_t = (r_d - r_f) S_t dt + \sigma S_t dW_t^{\mathbb{Q}} $$ 使用此動態學為外匯匯率的歐式買權定價，直接導出Garman-Kohlhagen 公式，即 Black-Scholes 公式的外匯版本。

4. 結果與討論

4.1. Garman-Kohlhagen 模型

熵推導的最終輸出是歐式買權定價的 Garman-Kohlhagen 模型： $$ C = S_0 e^{-r_f T} \Phi(d_1) - K e^{-r_d T} \Phi(d_2) $$ 其中 $$ d_1 = \frac{\ln(S_0/K) + (r_d - r_f + \sigma^2/2)T}{\sigma\sqrt{T}}, \quad d_2 = d_1 - \sigma\sqrt{T} $$ $S_0$ 是即期匯率，$K$ 是履約價，$T$ 是到期時間，$r_d$ 和 $r_f$ 分別是國內和國外無風險利率，$\sigma$ 是波動率，$\Phi$ 是標準常態累積分佈函數。

4.2. 與傳統方法比較

本文的主要貢獻是方法論上的。它並非透過隨機微積分和避險論證，而是透過一個基於熵最大化和對稱性的資訊理論、第一性原理方法，重新推導出既有的模型（GBM、Garman-Kohlhagen）。這為這些模型提供了更深層、更基礎的理論依據，並為通過納入不同或更複雜的資訊約束來推廣這些模型打開了大門。

5. 核心洞見與分析師觀點

核心洞見： 本文並非提出一個新的、更好的定價公式；它是一場哲學上的權力遊戲。它主張，從 Bachelier 到 Black-Scholes 的整個連續時間金融大廈，都可以從頭開始使用資訊理論和最大熵原理重建。作者基本上是在說：「暫時忘掉伊藤引理；市場的行為，在給定我們所知資訊的情況下，只是它可能做的最不令人驚訝的事情。」這是從建模價格到建模關於價格的知識的深刻轉變。

邏輯流程： 論證優雅而簡潔。1) 我們有不完整的資訊（先驗分佈）。2) 我們有對稱性（尺度不變性）。3) 我們使用改變最小的工具（最大相對熵）更新信念。4) 這種更新，被解釋為動態學，就得到了 GBM。5) 無套利原則確定了漂移率，為定價提供了風險中性測度。這是一個乾淨、由公理驅動的推導，相比之下，傳統的偏微分方程/避險論證顯得有些笨拙。

優點與缺陷： 優點在於基礎的優雅性和推廣的潛力。正如在物理學中 E.T. Jaynes 和後來的 Caticha 的工作所見，熵方法擅長從簡單原理推導出典範結果。缺陷在於，如同許多優雅理論一樣，與混亂現實之間的差距。該框架優雅地推導出 GBM，但 GBM 本身對於外匯來說是一個有缺陷的模型（它低估了尾部風險，忽略了波動率叢聚）。本文簡要提到了關於跳躍和資訊幾何的未來工作，這才是真正的考驗所在。這個框架能否通過簡單地添加正確的約束，自然地納入市場的典型事實（例如厚尾），還是需要臨時調整而稀釋其純粹性？

可操作的洞見： 對於量化分析師和模型驗證人員，本文是必讀之作。它為模型風險評估提供了一個新的視角。不僅僅是測試模型的擬合度，還要問：「這個模型假設了什麼資訊？這個資訊集是完整的或合適的嗎？」對於創新者，路線圖很清晰。下一步是使用這個框架來建構新的模型。如同作者提及 Bates 和 Heston 模型時所暗示的，用關於觀察到的波動率微笑或跳躍頻率的資訊來約束熵最大化。目標是一個連貫、統一的衍生性商品定價理論，而不是拼湊不相容的模型。Peters 和 Gell-Mann (2016) 關於遍歷性經濟學的工作顯示，類似的基礎性反思正在獲得關注。本文是朝著這個方向邁出的堅實一步，但除了哲學吸引力之外，其實用性最終將由市場來評判。

6. 技術細節

數學核心涉及在約束條件下，最大化後驗分佈 $P(x'|x)$ 相對於先驗 $Q(x'|x)$ 的相對熵 $\mathcal{S}[P|Q]$。一個關鍵約束是預期平方位移，它引入了波動率 $\sigma$： $$ \langle (\Delta x)^2 \rangle = \kappa dt $$ 其中 $\kappa$ 與波動率 $\sigma$ 相關。最大化得到一個高斯轉移機率： $$ P(x'|x) \propto \exp\left(-\frac{(x' - x - \alpha dt)^2}{2\kappa dt}\right) $$ 在連續極限下，這導致 $x_t$ 的漂移-擴散隨機微分方程。透過將標準的風險中性估值論證應用於推導出的 GBM 過程，建立了與 Black-Scholes-Merton 偏微分方程的聯繫。

7. 分析框架範例

案例：納入波動率微笑資訊。 熵框架允許整合額外的市場數據。假設，除了即期價格和歷史波動率，我們還擁有來自選擇權市場的資訊，暗示對數報酬的風險中性分佈並非高斯分佈，而是具有負偏態和超額峰度（波動率微笑）。

步驟 1：定義約束。 除了變異數約束 $\langle (\Delta x)^2 \rangle = \sigma^2 dt$，我們從觀察到的隱含波動率曲面添加動差約束： $$ \langle (\Delta x)^3 \rangle = \tilde{S} dt, \quad \langle (\Delta x)^4 \rangle - 3\langle (\Delta x)^2 \rangle^2 = \tilde{K} dt $$ 其中 $\tilde{S}$ 和 $\tilde{K}$ 捕捉單位時間的偏態和峰度。

步驟 2：最大化熵。 在四個約束（均值、變異數、偏態、峰度）下最大化相對熵，會導致轉移機率 $P(x'|x)$ 由 Gram-Charlier 級數或更一般的指數族分佈描述，而非簡單的高斯分佈。

步驟 3：推導動態學。 由此產生的連續時間極限將是一個具有狀態依賴漂移和波動率的擴散過程，或者可能是一個跳躍-擴散過程，有效地從資訊第一性原理推導出類似 Bates 或 Heston 的模型，而不是預先指定一個隨機波動率過程。

這個範例展示了該框架透過明確地將更細粒度的市場資訊作為約束納入，從而系統性地推廣模型的能力。

8. 未來應用與方向

熵動態框架為計量金融的未來研究開闢了幾個有前景的途徑：

多資產投資組合與資訊幾何： 作者提到將資訊幾何應用於投資組合選擇。這可能導致基於當前市場分佈與目標最優分佈之間的「距離」的新穎資產配置策略，超越均值-變異數最佳化。
建模典型事實： 該框架天生適合納入眾所周知的實證特徵，如厚尾、波動率叢聚和槓桿效應，方法是添加適當的動態約束，或使約束本身基於過去的資訊而具有時間依賴性。
非平穩與狀態轉換市場： 相對熵中的先驗分佈 $Q$ 可以動態更新以反映變化的市場狀態，可能為建構能對結構性斷裂做出反應的自適應模型提供一種有原則的方法。
行為金融整合： 「資訊」約束可以擴展到包括投資者情緒或關注度的度量指標，從而彌合傳統計量金融與行為模型之間的差距。
機器學習協同效應： 最大熵原則是許多機器學習方法的基石。該框架可以為混合機器學習-金融模型提供嚴格的資訊理論基礎，解釋為什麼某些神經網路架構或正則化技術對金融時間序列效果良好。

最終目標是建立一個統一、基於公理的市場動態學理論，既理論上健全又實證準確，減少當今金融工程中常見的臨時模型修補需求。

9. 參考文獻

Jaynes, E. T. (1957). Information Theory and Statistical Mechanics. Physical Review, 106(4), 620–630.
Caticha, A. (2012). Entropic Inference and the Foundations of Physics. In Proceedings of the MaxEnt 2012 conference.
Garman, M. B., & Kohlhagen, S. W. (1983). Foreign currency option values. Journal of International Money and Finance, 2(3), 231–237.
Black, F., & Scholes, M. (1973). The pricing of options and corporate liabilities. Journal of Political Economy, 81(3), 637–654.
Peters, O., & Gell-Mann, M. (2016). Evaluating gambles using dynamics. Chaos: An Interdisciplinary Journal of Nonlinear Science, 26(2), 023103. https://doi.org/10.1063/1.4940236
Amari, S. I. (2016). Information Geometry and Its Applications. Springer.
Bachelier, L. (1900). Théorie de la spéculation. Annales scientifiques de l'École Normale Supérieure, 3(17), 21–86.

目錄