Quantum Machine Learning methods for Fourier-based distribution estimation with application in option pricing
创建于 更新于
摘要
本论文提出两种基于参数化量子电路(PQC)的量子机器学习(QML)混合经典-量子方法,利用傅里叶级数估计概率分布并应用于期权定价。通过对概率密度函数(PDF)和累积分布函数(CDF)的傅里叶展开,结合PQC模型训练和量子加速蒙特卡洛(QAMC)算法进行性能比较,展示了QML方法在提取傅里叶系数及期权定价中达到较高精度并具备竞争力的效果。数值试验表明,样本规模和PQC结构复杂度显著影响结果准确度,且无监督基于CDF的方法在实务采样场景中表现尤为优异[page::0][page::4][page::10][page::20][page::23]
速读内容
选用量子机器学习结合傅里叶级数展开实现期权定价 [page::0][page::3][page::8]
- 建立基于参数化量子电路(PQC)的量子机器学习模型用于估计标的资产的概率分布(PDF或CDF)。
- 利用傅里叶级数将定价积分转化为两函数傅里叶系数乘积的求和表达式,简化计算。
- 两种训练方法:监督学习估计PDF和自监督学习估计CDF,后者更适合行业实务,仅需样本数据。
- 第三种基准方法为量子加速蒙特卡洛(QAMC),配合带符号估计算法mRQAE,准确估算傅里叶系数。
参数化量子电路(PQC)的通用性和表达力理论支撑 [page::4][page::5][page::6]
- PQC可视作含参数的量子神经网络,输出函数形式可表示为傅里叶级数形式,频率由编码哈密顿量决定。
- 相关定理证明存在适当宽度(PQC层数和比特数)使其能任意精度逼近任意连续及Sobolev空间内函数。
- 利用这些理论,PQC作为概率分布的逼近器在期权价格计算中提供数学保证。
训练方法和损失函数设计 [page::10][page::13][page::14]
- 方法一监督学习:用带标签的数据训练PQC拟合概率密度函数及其导数,损失函数包含均方误差和导数信息(差分学习思想)。
- 方法二自监督学习:针对只有样本但无标签场景,使用经验累积分布函数(empirical CDF)估计,并结合积分性质和正则项设计损失函数。
- 两种方法均在扩展区间[-2π,2π]上训练,避免傅里叶展开的吉布斯现象,提升傅里叶系数提取的稳定性和准确性。
数值实验及性能比较 [page::17][page::19][page::20][page::21][page::22]
- 以Black-Scholes模型下欧式看跌期权定价为例,测试三种方法的定价准确性和收敛性。
- 实验采用不同规模数据集和PQC结构,结果显示方法一和方法二均随样本量和PQC复杂度增长而收敛正确定价。
- QAMC法(方法三)精度较高且波动较小,但需要大量量子次(shots),计算成本显著高于QML方法。
- 方法二只需约10,000个样本即可达到与QAMC数十万shots相当的精度,且更贴近实际行业中无完整概率分布的环境。
量化因子构建与策略总结 [page::10][page::13][page::20]
- PQC结构设计涉及n个qubit,构成n层量子电路,训练得到的输出函数即为傅里叶级数系数的估计。
- 傅里叶系数通过训练后电路的输出多点采样和离散傅里叶变换得到,转换为正余弦系数形式。
- 这种量化方法实现了经典统计学习与量子计算的结合,将金融数据的复杂分布映射为量子可操控的参数空间。
- 回测显示训练集规模、PQC参数规模对估计的稳定性和准确度影响显著,存在复杂度与稳定性的权衡。

PQC拟合PDF/CDF的预测效果示例 [page::21]


QAMC法收敛趋势与量子采样成本分析 [page::22]

- QAMC法精度提升需大幅增加shots数,成本增长迅速,约5000 shots/系数,总shots数达数十万。
- QML方法在准确度接近时成本远低于QAMC,显示其作为增补方案的潜力。
深度阅读
元数据与概览
报告标题: Quantum Machine Learning methods for Fourier-based distribution estimation with application in option pricing
作者: Fernando Alonso, Álvaro Leitao, Carlos Vázquez
发布机构: CITIC Research center, Galician Supercomputing Center (CESGA), University of A Coruña, Spain
发布日期: 2025年10月23日
主题: 本文研究了基于量子机器学习(Quantum Machine Learning,QML)方法结合傅里叶级数展开技术,在金融衍生品定价特别是期权定价中的应用。本文提出两种混合经典-量子方法,通过参数化量子电路(Parametrized Quantum Circuits,PQC)学习统计分布的傅里叶系数,实现对衍生品的高效估值,并以量子加速蒙特卡洛(Quantum Accelerated Monte Carlo,QAMC)方法作为基准进行性能和精度的比较分析。
核心论点与信息:
- 传统金融衍生品估值中,高计算复杂度体现在蒙特卡洛积分上,而量子计算技术,尤其是QML,可以有效提升计算效率。
- 提出的两种基于PQC的QML方法能够重构概率分布的傅里叶展开,准确估计期权价格。
- 通过数值实验验证,方法具有良好的准确性和泛化能力,成为对传统QAMC方法的有力补充。
- QAMC作为基准方法,用于衡量QML方法在计算成本和精度方面的优越性。
本报告旨在展现QML赋能金融衍生品估值的潜力,强调在实际中无需精确概率密度函数(PDF)即可通过市场样本数据估计,有很强的实用价值。[page::0,1,2]
---
深度章节解读
1. 引言与背景(Section 1 & 2)
报告开篇介绍量子计算基本概念及其在金融中的应用背景,特别强调金融衍生品定价的重要性和当前计算挑战。说明期权作为最重要的衍生品,是研究重点。文中定义金融衍生品价格作为未来标的资产价格的函数,且标的资产价格视为随机过程,通常用随机微分方程刻画。期权价格以风险中性概率下的期望值形式给出,包含对未来价格分布的积分计算,此积分给出了定价的数学核心。[page::0,2,3]
2. 量子机器学习及PQC表示(Section 2.2)
- 关键观点: 参数化量子电路(PQC)作为量子机器学习模型的主要载体,类似经典神经网络,通过学习参数 \(\pmb{\theta}\),实现对输入数据的函数映射。
- 核心技术: PQC能够将输入变量通过数据编码门映射到量子态上,并通过可训练的量子门调整电路参数。最终的输出为对某个测量算符的期望值。
- 傅里叶级数表达: 重要的是PQC模型输出函数可以被表示为傅里叶级数(基于量子系统哈密顿量的谱结构),其频率集由编码哈密顿量特征值差决定,系数由模型参数调整。这为使用傅里叶分析工具研究PQC表达能力和泛化能力提供了理论基础。
- 泛函逼近定理: 文献和作者自身的工作证明,借助足够复杂的PQC和合适设计的哈密顿量,PQC可在连续函数空间、Lp空间及Sobolev空间中实现任意小的逼近误差,体现了PQC的普适性和表达能力。这些深刻的数学定理(见Theorem 2.1至2.3)保证了PQC可以理论上完美拟合概率分布函数等关键函数。[page::3,4,5,6]
3. 量子加速蒙特卡洛技术(QAMC)(Section 2.3)
- 传统蒙特卡洛方法: 方程设定下的期望计算通过生成独立样本求均值实现,虽然广泛使用,但计算复杂度较高。
- 量子加速蒙特卡洛(QAMC): 通过构造包含积分函数信息的量子状态,利用量子振幅估计(如QAE)实现均方误差的二次加速,减少采样量。
- 挑战及改进: 原QAE依赖量子相位估计,较难实现,迭代量子振幅估计(IQAE)、实数量子振幅估计(RQAE)等变体被提出以克服限制。
- 其他相关成果: 近来将积分函数分解为傅里叶级数并用QML估计系数的方法也获得关注,为本文技术路线提供先行参考。[page::6,7]
4. 方法提出(Section 3)
4.1 基于傅里叶级数展开的PDF和CDF估计方法(Section 3.1)
- 基于PDF的估计: 利用区间上的截断傅里叶三角级数展开近似概率密度函数,期权估价积分转化为对应傅里叶系数的乘积和求和。傅里叶系数由PQC训练得到,支付函数系数由解析式直接计算。
- 基于CDF的估计: 由于积分函数不平滑、支持集可能无界,从数字稳定性角度出发,采用CDF的傅里叶展开可更好处理支付函数奇点和积分区域的不规则性。通过分段积分和分部积分法,将积分表达为涉及CDF傅里叶系数的新形式。
- 傅里叶系数提取方法: PQC通过数据训练学习函数,采用离散傅里叶变换(DFT)从PQC输出中计算傅里叶系数。
- 强调训练时数据区间的选择: 为防止边界Gibbs现象,训练时扩大数据区间至 \([-2\pi, 2\pi]\) 但重缩至 \([- \pi, \pi]\),提供傅里叶展开光滑性优势。[page::8,9,10,11]
4.2 三种具体方法说明(Section 3.2)
- 方法I(有标签训练—监督学习,PDF估计): 利用可获得概率密度标签的模拟数据训练PQC逼近概率分布,使用包含输出以及输出导数的经验风险(Differential Machine Learning理念),提高训练效果。提取傅里叶系数并用解析系数求期权价格。
- 方法II(无标签训练—自监督,CDF估计): 针对实际中缺少PDF情况,只能获得资产样本,模型通过拟合经验CDF和导数风险函数同时训练PQC,能够在无直接标签下估计CDF傅里叶系数,实现期权定价。
- 方法III(量子加速蒙特卡洛,QAMC+mRQAE): 利用精确模型构造量子状态实现概率密度PDF的傅里叶系数测量,采用改进实数量子振幅估计(mRQAE)恢复傅里叶系数符号和幅值,作为QML方法的基准。
- mRQAE重要性: 相较传统QAE,能够估计正负系数并以较高效率收敛,适合傅里叶系数求解。
- 对三个方法傅里叶系数获取方式的不同及优缺点明晰。[page::11,12,13,14,15,16,17]
5. 数值实验设置(Section 4.1)
- 金融模型背景: 选择Black–Scholes资产价格模型,参数 \(S0=100, r=0.1, \sigma=0.25, T=1\),行权价取三个典型值\(K=90,100,110\),涵盖实值期权、平值期权和虚值期权情况。
- 训练超参数: 表1展示各方法训练优化参数,如Adam优化器、学习率、迭代次数、差异学习权重比例和训练/测试集规模。
- PQC结构和规模: 实验以不同qubit数×层数配置(如6×6, 4×4)验证模型复杂度影响。
- 硬件环境及软件版本(详见表2),保证结果复现性和准确性。
- 方法III中采用多shot数(量子执行次数)调整精度。[page::18,19]
6. 数值结果与分析(Section 4.2)
6.1 数据量影响(Section 4.2.1)
- 三方法均随着训练数据规模增加,期权价格估计趋近精确解。
- 方法I与II在数据大小较小时表现波动,因量子参数初始化随机性带来训练噪声。建议多次训练稳定结果。
- 方法II仅基于无标签资产路径样本,体现实际金融市场数据使用优势。
- 方法III误差较小且波动性低,得益于QAE测量的精确定义,但高准确度需大量shots( ~5000次/系数,整体达到数十万次量子执行),计算资源消耗大。
- 方法II用约10000训练样本量取得接近方法III的精度,显示QML方案在训练代价与精度间的较好平衡。[page::20,21,22]
6.2 傅里叶系数数目与PQC结构影响(Section 4.2.2)
- 过多傅里叶项可能导致85套振荡、不稳定现象,特别在CDF方法中,由于边界周期不连续产生Gibbs效应。
- 适中规模的PQC(如7×7、5×5)能够取得最佳估计性能。体现模型表达容量与数据拟合的权衡。
- 对QAMC(方法III),增加系数数量提升结果准确性及收敛性,尤其当shots数量较小时更为明显。
- 所有方法均表现出随着模型复杂度提高,结果稳定且收敛趋势强。
综上,选择合理傅里叶项数量和PQC规模对获得鲁棒且高效的估计尤为重要。[page::23]
---
图表深度解读
图1(第4页)
展示了组成PQC的量子电路结构示意图。每层包含固定相同的数据编码电路块 \(SH(x)\) 和可训练单元 \(W^{(i)}(\theta)\),最终测量多个qubit。该示意图辅助理解PQC工作流程与傅里叶展开表达的生成过程,反映了训练参数与数据的层层交织。此电路多层重复结构体现了PQC表达丰富性和可调性基础。[page::4]
图2与图3(第12页)
- 图2: 两幅子图比较了PDF逼近时训练区间选择对模型输出预测的影响。
- (a) 训练区间为 \([- \pi, \pi]\),边界存在显著波动和非平滑行为。
- (b) 训练区间扩展到 \([- 2\pi, 2\pi]\),输出曲线更平滑,减少Gibbs现象影响。
- 图3: 类似比较CDF逼近在不同训练区间下的表现。
- 区间扩展大幅改善CDF两端跳跃,降低周期延拓导致的振荡,提升数值稳定性。
两图共同强调选择训练区间大于目标预测区间的重要性,支持报告中宽区间训练以获得更稳定傅里叶系数估计的策略。[page::12]
图4(第12页)
展示了所用PQC中的量子电路“ansatz”示意图,典型由两量子比特组成,每层包含基于输入x的旋转门 \(Rx(x)\),以及可训练旋转门 \(Ry(\theta)\),再接一个CNOT纠缠门。该电路结构是标准且通用的组合,体现了训练参数与数据编码相结合以表达复杂函数的设计理念。[page::12]
图5(第20页)
- 由六个子图组成,左列为方法I,右列为方法II,每图展示不同PQC尺寸下随着数据集大小变化的期权价格估计均值和方差。
- 趋势明确: 随数据集增大,价格估计收敛至理论值(虚线),表明训练数据量对模型泛化性能极其关键。
- 不同PQC规模表现有差异,但总体均表现为收敛且方差随数据增大缩小。
- 三个行权价下定价均合理呈现,展示模型适应多种金融条件能力。
- 图例色彩编码行权价,详细展示多变量条件影响。
此图深刻验证了模型在不同训练条件下的准确性与稳定性。[page::20]
图6与图7(第21页)
- 图6显示方法I下不同PQC规模的模型输出,中位数以及第25、第75百分位,真实概率密度函数标出。
- 图7对应方法II,同样展示CDF拟合质量。
- 两图结果显示模型拟合曲线贴合真实函数,且置信区间逐渐收紧,印证方法理论性质。
- 结果强调模型在训练充分条件下能准确拟合概率分布相关的函数。
这两张图是对方法I、II直观函数拟合质量的实证展示。[page::21]
图8(第22页)
- 展示了方法III(QAMC+mRQAE)在不同PQC规模下随着shots数增加的期权定价准确度及置信区间。
- 结果显示随着shots增加,估计值稳定于理论价格,误差和波动大幅降低。
- 高shots需求导致较大计算成本,凸显QML方法相比的优势。
- 图形进一步显示PQC规模及采样数量对结果质量的共同影响。
图8作为对比基准,明确展现了QAMC优缺点和计算资源需求。[page::22]
---
估值分析
- 定价公式基于风险中性期望折现形式(公式(1)),转化为对标的资产价格未来分布积分。
- 利用概率密度或累积分布函数的傅里叶级数截断表示,将复杂积分转为傅里叶系数乘积与加和,提高数值稳定性和计算便利。
- 方案中,基于PQC的QML模型用傅里叶系数形式表达概率分布,经过优化训练获得系数,结合解析支付函数傅里叶系数,实现估值。
- QAMC则通过构建量子态和mRQAE测量获得傅里叶系数,量子测量精度提升理论上保证方差降低,但计算代价巨大。
- 报告中采用的傅里叶级数截断阶数和PQC规模共同决定了模型复杂度和估值准确度,需权衡选取。
- 两种经典-量子混合方法可视为对蒙特卡洛积分的傅里叶分解改写,提升估值过程效率和精度,同时具备量子模型的柔韧性和泛化能力。
- 设置合理概率分布区间及傅里叶周期,减轻Gibbs效应对估值的负面影响。[page::8,9,10,13,16,23]
---
风险因素评估
报告并未专门列出单独“风险”章节,但从以下角度可以识别风险因子:
- 优化和训练稳定性风险: 随机初始化和训练过程中的非凸优化属性导致估计过程中可能出现波动和收敛到局部最优。训练结果呈现一定随机性,需多次重复实验确认统计稳定。
- 模型复杂度与过拟合风险: 过多傅里叶项或PQC规模过大,可能导致振荡和过拟合,反而降低估计稳定性。
- 截断和周期选择风险: 选择傅里叶级数截断和训练区间不当,尤其CDF边界周期延拓,可能产生Gibbs现象,造成峰值振荡,影响估值精度。
- QAMC计算开销风险: 若求高度准确傅里叶系数,shots需求巨大,实际运算负担沉重。
- 数据样本代表性风险: 模型准确性依赖训练数据代表性,尤其在方法II中,采样分布偏差会致使结果偏离真实价格。
- 量子硬件误差和噪声风险: 尽管未详述,实际量子计算面临硬件噪声影响,或影响模型训练和QAMC精度。
报告就部分训练波动提出多次实验及统计分析建议,部分负面影响可通过合理模型设计、参数选择、扩大样本量等策略缓解。[page::20,21,23]
---
审慎视角与细微差别
- 报告中方法I和方法II的训练超参数差异较大(如学习率和权重分配),显示作者根据任务性质调整策略,但未详细讨论不同参数选择的敏感性,存在未尽之处。
- 实验中波动性表现提示训练优化过程或许存在依赖初始值敏感等潜在不稳定因素,未来或需结合更复杂优化算法以提升稳定性。
- QAMC方法虽准确但计算资源需求高,存在实际部署限制,报告虽提及对比优势,但未深度探讨实际硬件限制及资源管理。
- 训练区间选择策略(扩大到[-2π,2π])有效缓解Gibbs现象,但也暗示对真实数据无信息区间存在自由度,此设计可能在其他数据分布中带来误差累积,需要注意。
- 三个方法中,方法II在无标签场景下表现突出,实际金融市场应用意义高,但报告对于该方法对异常样本或市场结构突变情况下的鲁棒性没有深入探讨。
- PQC泛化能力理论强,但在实际训练中,很难保证训练达到理论极限,报告关注点偏理论及模拟实证,缺少真实量子硬件测试表现。
整体来看,报告科学严谨,能够较好呈现QML在期权估值中的机遇和挑战,但在真实世界场景验证和系统性风险分析上尚有发展空间。
---
结论性综合
本报告以量子机器学习为基础,结合傅里叶级数理论,针对金融衍生品期权定价问题提出两种混合经典-量子方法,实现了对底层资产价格分布的高精度傅里叶系数估计,进而计算期权价格。通过理论证明保障了PQC的普适逼近性和表达能力,使得训练而得的傅里叶系数极具理论支撑。此外,结合自监督学习,方法II突破了依赖显式概率密度标签的限制,更贴合金融市场实际,基于市场样本即可估值。数值实验证明,随着训练样本数量和PQC复杂度增加,两方法定价估计表现出稳定收敛于理论价格的趋势,联合差分机器学习(DML)思想提高训练效果,有效缓解了优化过程中训练误差和模型振荡带来的不确定性。
作为基准,QAMC方法通过高精度振幅估计提供对傅里叶系数准确量子测量,确保估值准确性,但计算资源需求较大,约需数十万量子测量次数,凸显了QML混合方法在资源和效率上的潜在优势。图形分析直观地展示了三种方法在不同设置下的估值能力和误差波动,进一步强调了模型规模与数据量对估值效果的重要作用,同时证实了适度傅里叶项截断和合理参数设计在保证估值稳定性上的必要性。
总结而言,本报告提出的基于PQC的QML傅里叶方法为金融衍生品定价开辟了新的路径,融合量子计算和傅里叶分析,兼顾理论严谨和实践可行性,具备应用于实际市场的潜力。未来可期的方向包括结合真实量子硬件测试,进一步精化训练算法和降低计算复杂度,增强模型在更加复杂金融产品和非标准市场环境下的适应力和鲁棒性。
---
参考文献及相关工作
报告整合了量子计算、量子机器学习、量子加速蒙特卡洛、金融期权定价、傅里叶分析、Sobolev空间逼近理论等多个领域的重要文献和最新研究,体现出全球学界当前技术前沿紧密结合金融应用的趋势。特别引用了多篇关于PQC函数逼近能力的理论文献,量子振幅估计的改进算法文献,以及近年来重要的衍生品定价相关量子计算论文,具有较高学术价值和现实指导意义。
---
综上,本报告是一篇结合量子机器学习与现代金融理论,系统探讨基于傅里叶分解的衍生品估值新方法的原创性研究,内容详实,数学基础扎实,实验设计严谨,理论与实证并重。其详尽解构对于同行在量子金融领域进一步研究和应用具有重要参考价值。

