匯率與選擇權的熵動態：一個最大熵框架

1. 緒論

本文提出一個熵動態框架，用於建模外匯匯率動態並為歐式選擇權定價。其核心目標是為傳統的隨機微積分方法提供一個替代性的、資訊理論的基礎。來自紐約州立大學奧爾巴尼分校的 Mohammad Abedi 與 Daniel Bartolomeo 兩位作者，利用熵推論與最大熵的原則來處理資訊不完整的情況——這是金融市場的普遍現實。該框架系統性地納入了已知的對稱性，例如尺度不變性，從而從第一性原理推導出幾何布朗運動與 Garman-Kohlhagen 模型等既有模型。

2. 理論框架

此方法建立在熵推論的三個支柱之上。

2.1. 熵推論基礎

熵推論是一個為不確定性下的推理而設計的歸納框架。它將古典邏輯擴展到處理部分資訊。機率分佈代表對系統的認知狀態。

2.2. 最小更新原則

當獲得新資訊時，先驗機率分佈會使用相對熵（Kullback-Leibler 散度）進行更新。此更新遵循最小更新原則，確保僅根據新數據的必要性進行變更，從而產生偏誤最小的後驗分佈。

2.3. 資訊幾何

機率分佈的空間形成一個黎曼流形，其獨特的度量源自 Fisher 資訊。這種資訊幾何提供了分佈之間的距離概念，這對於定義動態至關重要。作者指出其對投資組合最佳化的潛在重要性，將在未來工作中探討。

3. 外匯匯率的熵動態

熵動態將推論框架應用於建模系統如何變化，引入了系統特有的熵時間。

3.1. 尺度不變性與變數選擇

外匯市場的一個關鍵對稱性是尺度不變性：動態在如 $S \rightarrow \lambda S$ 的變換下應保持不變，其中 $S$ 是匯率。為了使此對稱性顯現，作者將 $x = \log S$ 確定為建模的自然變數，因為該變換變成了平移 $x \rightarrow x + \log \lambda$。

3.2. 幾何布朗運動的推導

透過基於關於外匯匯率的可用資訊（例如其預期漂移和波動率）施加約束，並在這些約束下最大化相對熵，該框架自然地導出 $x$ 的動態。轉換回 $S$ 即得到幾何布朗運動方程式： $$ dS_t = \mu S_t dt + \sigma S_t dW_t $$ 其中 $\mu$ 是漂移項，$\sigma$ 是波動率，$W_t$ 是維納過程。此推導顯示 GBM 是與給定的動差約束和尺度對稱性一致的最小偏誤模型。

4. 選擇權定價框架

為了對衍生性商品定價，一個風險中立評價框架對於避免套利至關重要。

4.1. 風險中立測度的推導

在熵框架內，從真實世界測度 $\mathbb{P}$ 轉換到風險中立測度 $\mathbb{Q}$ 被解釋為一個推論問題。它涉及用「折現資產價格必須是鞅（無套利）」這一新資訊來更新先驗（真實世界動態）。在此約束下應用最小更新原則，會導出定義 $\mathbb{Q}$ 的 Girsanov 定理轉換。

4.2. Garman-Kohlhagen 模型

將風險中立測度應用於外匯匯率的 GBM 動態（涉及兩個利率：本國利率 $r_d$ 和外國利率 $r_f$），並求解歐式選擇權的 Black-Scholes-Merton 偏微分方程，即得到Garman-Kohlhagen 公式： $$ C = S_0 e^{-r_f T} \Phi(d_1) - K e^{-r_d T} \Phi(d_2) $$ 其中 $$ d_1 = \frac{\ln(S_0/K) + (r_d - r_f + \sigma^2/2)T}{\sigma\sqrt{T}}, \quad d_2 = d_1 - \sigma\sqrt{T}. $$ 此結果使熵動態方法與標準的外匯選擇權定價模型保持一致。

5. 技術分析與核心見解

核心見解：這篇論文不僅僅是對 Black-Scholes 的另一種推導；它是一次哲學上的強力宣示。它主張整個連續時間金融的體系——從 GBM 到風險中立定價——不僅僅是一個方便的數學技巧，而是在特定對稱性下，將最保守的邏輯（最大熵）應用於不完整資訊的必然結果。作者基本上是在說：「如果你接受這些關於我們應如何在未知情況下推理的公理，那麼你使用的模型就是被強加給你的。」

邏輯流程：論證優雅且連貫：1) 公理：使用機率量化信念，並在新資訊到來時以最小方式更新（MaxEnt）。2) 約束：外匯匯率具有尺度對稱性。3) 推導：GBM 出現。4) 新約束：無套利。5) 推導：風險中立測度和 Garman-Kohlhagen 出現。從第一性原理到業界標準公式的流程清晰且具說服力。

優點與缺陷：其優點在於基礎的清晰度。它透過將風險中立定價框架為一個邏輯推論步驟，來揭開其「魔法」面紗。然而，其缺陷在於其自身的前提：它推導的是一個已有 50 年歷史的模型。真實世界存在隨機波動率、跳躍和流動性緊縮——這些現象都被這個純粹的推導所忽略。正如 Cont (2001) 關於模型限制的開創性研究所指出的，GBM 的實證失敗已有充分記載。此框架在目前的形式下，更擅長為過去辯護，而非指導未來。它對於許多量化分析師已不再提問的問題，給出了一個精彩的答案。

可操作的見解：對於實務工作者而言，直接的收穫有限——你無法從中編寫出更好的定價引擎。真正的價值是策略性的：1) 模型治理：將此作為解釋為何使用標準模型的基準，以滿足驗證委員會的要求。2) 研究方向：真正的潛力在於未走之路。論文暗示了將資訊幾何用於投資組合理論。這是一座金礦。未來的工作不應再推導舊結果，而應使用此框架的工具——例如 Fisher 度量——來衡量不同市場狀態之間的「資訊距離」，或建立本質上尊重更複雜約束（例如尾部行為）的動態模型，從而超越 GBM 的束縛。

6. 原創分析：批判性觀點

Abedi 和 Bartolomeo 的論文提出了一個引人入勝的智力練習，透過資訊理論的視角重新框架古典金融數學。其主要貢獻不是一個新模型，而是對現有模型——幾何布朗運動和 Garman-Kohlhagen 模型——的新穎推導與正當化。這與量化金融中尋求更基本原理的廣泛趨勢一致，讓人聯想到經濟學中的公理化方法或物理學中對第一性原理的追求。

從技術上講，應用最大熵原理來推導動態是優雅的。由於尺度不變性而將 $\log S$ 識別為正確變數，是一個關鍵且理由充分的步驟。它呼應了在幾乎所有繼 GBM 之後的隨機波動率和跳躍擴散模型中對數價格的使用。然而，該框架的輸出——標準的 GBM——是其最大的限制。自 1987 年股災和 2008 年危機以來的金融文獻壓倒性地證明了 GBM 的實證缺陷：它無法捕捉波動率叢聚（如 GARCH 模型所示）、厚尾報酬，以及選擇權市場中普遍存在的波動率微笑/偏斜。Heston (1993) 等模型或 Cont 和 Tankov (2004) 回顧的無限活動 Lévy 過程，正是為了解決這些差距而發展的。

因此，這篇論文的意義不在於其最終方程式，而在於其方法論的潛力。熵推論框架本質上是靈活的。用於推導 GBM 的約束（報酬的均值和變異數）過於簡化。真正的考驗將是施加更現實的約束——例如觀察到的波動率之波動率，或報酬分佈的某些動差——並觀察會產生什麼動態。它能推導出 Heston 類型的模型嗎？這將是一個更具影響力的貢獻。文中提及未來將資訊幾何用於投資組合最佳化的工作特別令人期待。Fisher 資訊度量可以提供一種嚴謹的方法來衡量投資組合對參數估計誤差的穩定性或敏感性，這是一個實務上非常關注、但通常以啟發式方法處理的主題。

總而言之，這項工作是一個複雜的概念驗證。它成功將熵動態框架從物理學移植到金融學，並顯示其能夠複製基礎結果。其價值將取決於後續研究能否利用此框架的機制來解決這些基礎本身已知的缺陷，從優雅的辯護走向真正的創新。

7. 數學框架與技術細節

核心的數學引擎是在約束下最大化相對熵（Kullback-Leibler 散度）。給定一個先驗分佈 $q(x)$ 和以多個函數 $f_i$ 的期望值 $\mathbb{E}_p[f_i(x)] = F_i$ 形式呈現的新資訊，後驗分佈 $p(x)$ 可透過最小化以下式子求得： $$ D_{KL}[p||q] = \int p(x) \ln \frac{p(x)}{q(x)} dx $$ 並滿足 $\int p(x) f_i(x) dx = F_i$ 和歸一化條件 $\int p(x) dx = 1$。使用拉格朗日乘數 $\lambda_i$，解為： $$ p(x) = \frac{1}{Z} q(x) \exp\left(-\sum_i \lambda_i f_i(x)\right) $$ 其中 $Z$ 是配分函數。在動態的背景下，$q(x)$ 代表從初始狀態轉移的機率，而約束則編碼了系統的預期漂移和波動。對於外匯應用，以 $x = \log S$ 為例，對預期變化 $\mathbb{E}[\Delta x]$ 及其變異數 $\mathbb{E}[(\Delta x)^2]$ 的約束會導致高斯轉移機率，在連續極限下產生 GBM 基礎的擴散方程式。

轉換到風險中立測度 $\mathbb{Q}$ 涉及增加一個新約束：折現資產的預期報酬必須等於無風險利率。這修改了拉格朗日乘數，有效地引入了一個漂移調整項 $\theta$，使得 $dW^{\mathbb{Q}}_t = dW^{\mathbb{P}}_t + \theta dt$，這就是 Girsanov 定理的本質。

8. 分析框架與案例範例

案例：為貨幣對（歐元/美元）的模型選擇提供正當化理由

情境：一家銀行的量化分析師負責開發一個為歐元/美元普通選擇權定價的模型。他必須向模型驗證委員會證明其模型選擇的合理性。

熵框架的應用：

陳述先驗資訊：分析師列出已知事實：歐元/美元為正值，其百分比變化比絕對變化更相關（尺度不變性），且歷史數據提供了平均漂移和波動率的估計值。
應用最小更新原則：從最大無知狀態（$\log S$ 的平坦先驗）開始，分析師透過最大熵納入漂移和波動率約束來更新信念。
推導動態：該框架輸出 GBM 作為與兩個動差約束一致的最小偏誤模型。分析師向委員會展示此推導，主張使用任何具有更多參數的模型（例如隨機波動率模型）將需要相應的額外、統計上穩健的資訊來證明更複雜的更新是合理的。
定價：為了對選擇權定價，分析師加入無套利約束，推導出風險中立測度和 Garman-Kohlhagen 公式。

結果：委員會接受 GBM/Garman-Kohlhagen 作為基準模型，因為它是從有限資訊中有原則地推導出來的。他們可能僅在分析師能夠證明（或許使用相同的熵邏輯）額外的市場數據（例如波動率微笑）提供了足夠的資訊來保證從 GBM 先驗進行更複雜的更新時，才會批准針對特定期限/價位的更複雜模型（如 SABR）。

9. 未來應用與研究方向

熵動態框架在複製古典結果之外，開闢了幾個有前景的方向：

超越 GBM：納入對更高階動差（偏度、峰度）或波動率過程本身的約束，可能導致基於熵的局部/隨機波動率或跳躍擴散模型的推導。
投資組合建構中的資訊幾何：正如作者所暗示的，Fisher 度量可以量化不同市場環境之間的「統計距離」。這可用於：1) 開發穩健的投資組合策略，以最小化對估計參數誤差的敏感性。2) 透過監控近期報酬與當前模型之間的資訊距離，為狀態轉換創建早期預警訊號。
建模非流動性資產：對於數據稀疏的資產，最大熵方法提供了一種嚴謹的方法，可基於經濟原理或類似資產來指定先驗分佈，並在新交易發生時以最小方式更新它。
多資產動態：將框架擴展到多個相關資產。約束將包括相關性，而產生的動態將自然地尊重共變異數結構的幾何，可能為系統性風險提供見解。
與機器學習整合：「先驗更新」範式與貝氏機器學習一致。該框架可以指導設計將金融約束（如無套利）直接納入其架構或損失函數的神經網路，從而提高可解釋性和穩健性。

10. 參考文獻

Jaynes, E. T. (1957). Information Theory and Statistical Mechanics. Physical Review, 106(4), 620–630.
Caticha, A. (2012). Entropic Inference and the Foundations of Physics. In 11th Brazilian Meeting on Bayesian Statistics.
Garman, M. B., & Kohlhagen, S. W. (1983). Foreign currency option values. Journal of International Money and Finance, 2(3), 231–237.
Black, F., & Scholes, M. (1973). The pricing of options and corporate liabilities. Journal of Political Economy, 81(3), 637–654.
Cont, R. (2001). Empirical properties of asset returns: stylized facts and statistical issues. Quantitative Finance, 1(2), 223–236.
Heston, S. L. (1993). A closed-form solution for options with stochastic volatility with applications to bond and currency options. The Review of Financial Studies, 6(2), 327–343.
Cont, R., & Tankov, P. (2004). Financial Modelling with Jump Processes. Chapman and Hall/CRC.
Amari, S. I., & Nagaoka, H. (2000). Methods of Information Geometry. American Mathematical Society.