汇率与期权的熵动力学：一种外汇建模的新框架

1. 引言

本文提出了一种用于建模外汇汇率和定价欧式期权的熵动力学框架。其核心目标是超越传统的随机微积分，为金融动力学提供一个基于信息论的替代性基础。作者Mohammad Abedi和Daniel Bartolomeo利用熵推断的原则——一种在不完全信息下进行推理的方法——从第一性原理推导出众所周知的金融模型。

这项工作将最大熵和信息几何的抽象概念与实际金融应用联系起来，最终推导出汇率的几何布朗运动以及外汇期权的Garman-Kohlhagen模型。该方法突出了货币对固有的尺度不变性对称性，从而自然地选择对汇率的对数进行建模。

2. 理论框架

2.1. 熵推断与最大熵原理

熵推断是针对信息不完全情况的一种归纳框架。其第一个工具是概率论，用于表示信念状态。第二个是相对熵（或称Kullback-Leibler散度），在最小更新原则的指导下，用于在新信息到达时更新信念。最大化相对熵可以得到包含所有可用信息且偏差最小的后验分布。

第三个工具是信息几何，它为概率分布空间提供了一种度量。虽然本文未深入探讨，但作者指出了其在投资组合管理和多资产动力学方面的潜在重要性。

2.2. 熵动力学与时间

熵动力学应用熵推断来模拟系统的变化方式。一个关键的创新是引入了熵时间参数，该参数是涌现的，并针对特定系统定制，而非一个普适的时钟。这一概念已在多个物理学领域成功应用，并在此被引入金融领域。

2.3. 外汇中的尺度不变性

外汇市场的一个基本对称性是尺度不变性：无论我们将汇率报价为USD/EUR还是其倒数形式，其动力学特性不应改变。这种对称性决定了模型应该用汇率的对数 $x = \ln S$ 来表述，其中 $S$ 是即期外汇汇率。当用 $x$ 表示时，像 $S \to \lambda S$（简单缩放）这样的变换会使动力学保持不变。

3. 模型推导

3.1. 从熵原理到几何布朗运动

从关于外汇汇率的先验信息（特别是其初始值和波动率）出发，作者利用熵动力学框架推导其时间演化。通过施加与市场观察一致的约束（如有限方差）并最大化熵，结果表明未来对数汇率 $x$ 的概率分布遵循一个漂移-扩散过程。

转换回即期汇率 $S = e^x$，该过程就变成了熟悉的几何布朗运动： $$ dS_t = \mu S_t dt + \sigma S_t dW_t $$ 其中 $\mu$ 是漂移率，$\sigma$ 是波动率，$W_t$ 是维纳过程。该推导明确地尊重了尺度不变性。

3.2. 风险中性测度与期权定价

为了给衍生品定价，需要引入无套利原则。作者展示了如何在熵框架内推导风险中性测度 $\mathbb{Q}$。这涉及将GBM过程的漂移率调整为两种货币之间的无风险利率差 $(r_d - r_f)$。

在 $\mathbb{Q}$ 测度下，动力学变为： $$ dS_t = (r_d - r_f) S_t dt + \sigma S_t dW_t^{\mathbb{Q}} $$ 用此动力学为外汇汇率上的欧式看涨期权定价，直接导出了Garman-Kohlhagen公式，即Black-Scholes公式的外汇版本。

4. 结果与讨论

4.1. Garman-Kohlhagen模型

熵推导的最终输出是欧式看涨期权价格的Garman-Kohlhagen模型： $$ C = S_0 e^{-r_f T} \Phi(d_1) - K e^{-r_d T} \Phi(d_2) $$ 其中 $$ d_1 = \frac{\ln(S_0/K) + (r_d - r_f + \sigma^2/2)T}{\sigma\sqrt{T}}, \quad d_2 = d_1 - \sigma\sqrt{T} $$ $S_0$ 是即期汇率，$K$ 是行权价，$T$ 是到期时间，$r_d$ 和 $r_f$ 分别是本币和外币的无风险利率，$\sigma$ 是波动率，$\Phi$ 是标准正态累积分布函数。

4.2. 与传统方法的比较

本文的主要贡献是方法论上的。它并非通过随机微积分和对冲论证，而是通过基于熵最大化和对称性的信息论第一性原理方法，重新得到了已确立的模型（GBM、Garman-Kohlhagen）。这为这些模型提供了更深层、更基础的合理性，并通过纳入不同或更复杂的信息约束，为推广这些模型打开了大门。

5. 核心洞见与分析视角

核心洞见： 本文并非提出一个新的、更好的定价公式；这是一场哲学上的实力展示。它认为，从Bachelier到Black-Scholes的整个连续时间金融大厦，都可以使用信息论和最大熵原理从头开始重建。作者本质上是在说：“暂且忘记伊藤引理；在给定我们所知信息的情况下，市场行为只是它可能做出的最不令人惊讶的事情。” 这是从建模价格到建模关于价格的知识的深刻转变。

逻辑脉络： 论证过程优雅而简洁。1) 我们拥有不完全信息（先验分布）。2) 我们拥有对称性（尺度不变性）。3) 我们使用改变最小的工具（最大相对熵）来更新信念。4) 这种更新，被解释为动力学，就得到了GBM。5) 无套利原则确定了漂移率，从而得到了用于定价的风险中性测度。这是一个干净、由公理驱动的推导，相比之下，传统的偏微分方程/对冲论证显得近乎笨拙。

优势与不足： 优势在于基础理论的优雅性和推广潜力。正如在物理学中E.T. Jaynes和后来的Caticha的工作所展示的，熵方法擅长从简单原理推导出经典结果。不足在于，与许多优雅理论一样，它与混乱的现实之间存在鸿沟。该框架优雅地推导出了GBM，但GBM本身对于外汇建模是有缺陷的（低估尾部风险，忽略波动率聚集）。本文简要提到了未来关于跳跃和信息几何的工作，这才是真正的考验所在。这个框架能否通过简单地添加正确的约束，自然地纳入市场的典型事实（例如，厚尾），还是需要临时调整从而稀释其纯粹性？

可操作的见解： 对于量化分析师和模型验证者，本文是必读材料。它为模型风险评估提供了一个新的视角。不要仅仅测试模型的拟合度，而要问：“这个模型假设了哪些信息？这个信息集是否完整或恰当？” 对于创新者，路线图很清晰。下一步是利用这个框架构建新的模型。正如作者提及Bates和Heston模型时所暗示的，用关于观察到的波动率微笑或跳跃频率的信息来约束熵最大化。目标是建立一个连贯、统一的衍生品定价理论，而不是拼凑不相容的模型。Peters和Gell-Mann (2016)关于遍历性经济学的工作表明，类似的基础性反思正在获得关注。本文是朝着这个方向迈出的坚实一步，但除了哲学吸引力之外，其效用最终将由市场来评判。

6. 技术细节

数学核心涉及在约束条件下最大化后验分布 $P(x'|x)$ 相对于先验分布 $Q(x'|x)$ 的相对熵 $\mathcal{S}[P|Q]$。一个关键约束是期望平方位移，它引入了波动率 $\sigma$： $$ \langle (\Delta x)^2 \rangle = \kappa dt $$ 其中 $\kappa$ 与波动率 $\sigma$ 相关。最大化得到一个高斯转移概率： $$ P(x'|x) \propto \exp\left(-\frac{(x' - x - \alpha dt)^2}{2\kappa dt}\right) $$ 在连续极限下，这导出了 $x_t$ 的漂移-扩散随机微分方程。通过将标准的风险中性估值论证应用于推导出的GBM过程，建立了与Black-Scholes-Merton偏微分方程的联系。

7. 分析框架示例

案例：纳入波动率微笑信息。 熵框架允许整合额外的市场数据。假设，除了即期价格和历史波动率，我们还拥有来自期权市场的信息，暗示对数收益的风险中性分布不是高斯分布，而是具有负偏度和超额峰度（波动率微笑）。

步骤1：定义约束。 除了方差约束 $\langle (\Delta x)^2 \rangle = \sigma^2 dt$，我们从观察到的隐含波动率曲面添加矩约束： $$ \langle (\Delta x)^3 \rangle = \tilde{S} dt, \quad \langle (\Delta x)^4 \rangle - 3\langle (\Delta x)^2 \rangle^2 = \tilde{K} dt $$ 其中 $\tilde{S}$ 和 $\tilde{K}$ 捕获单位时间的偏度和峰度。

步骤2：最大化熵。 在均值、方差、偏度、峰度这四个约束下最大化相对熵，会得到一个由Gram-Charlier级数或更一般的指数族分布描述的转移概率 $P(x'|x)$，而不是简单的高斯分布。

步骤3：推导动力学。 由此产生的连续时间极限将是一个具有状态依赖漂移和波动率的扩散过程，或者可能是一个跳跃-扩散过程，从而有效地从信息第一性原理推导出类似Bates或Heston的模型，而不是预先指定一个随机波动率过程。

这个例子展示了该框架通过明确地将更细粒度的市场信息作为约束纳入，从而系统性地推广模型的能力。

8. 未来应用与方向

熵动力学框架为量化金融的未来研究开辟了几个有前景的途径：

多资产组合与信息几何： 作者提到了将信息几何应用于投资组合选择。这可能导致基于当前市场分布与目标最优分布之间的“距离”来制定新颖的资产配置策略，超越均值-方差优化。
建模典型事实： 该框架天生适合纳入众所周知的实证特征，如厚尾、波动率聚集和杠杆效应，方法是通过添加适当的动态约束，或使约束本身基于过去信息而具有时间依赖性。
非平稳与机制转换市场： 相对熵中的先验分布 $Q$ 可以动态更新以反映不断变化的市场机制，这可能为构建适应结构性断点的自适应模型提供一种原则性方法。
行为金融整合： “信息”约束可以扩展到包括投资者情绪或关注度的度量指标，从而弥合传统量化金融与行为模型之间的差距。
机器学习协同： 最大熵原理是许多机器学习方法的基石。该框架可以为混合机器学习-金融模型提供一个严格的信息论基础，解释为什么某些神经网络架构或正则化技术对金融时间序列效果良好。

最终目标是建立一个统一的、基于公理的市场动力学理论，该理论既在理论上健全，又在经验上准确，从而减少当今金融工程中常见的临时性模型修补需求。

9. 参考文献

Jaynes, E. T. (1957). Information Theory and Statistical Mechanics. Physical Review, 106(4), 620–630.
Caticha, A. (2012). Entropic Inference and the Foundations of Physics. In Proceedings of the MaxEnt 2012 conference.
Garman, M. B., & Kohlhagen, S. W. (1983). Foreign currency option values. Journal of International Money and Finance, 2(3), 231–237.
Black, F., & Scholes, M. (1973). The pricing of options and corporate liabilities. Journal of Political Economy, 81(3), 637–654.
Peters, O., & Gell-Mann, M. (2016). Evaluating gambles using dynamics. Chaos: An Interdisciplinary Journal of Nonlinear Science, 26(2), 023103. https://doi.org/10.1063/1.4940236
Amari, S. I. (2016). Information Geometry and Its Applications. Springer.
Bachelier, L. (1900). Théorie de la spéculation. Annales scientifiques de l'École Normale Supérieure, 3(17), 21–86.

目录