`

Trading with the Devil: Risk and Return in Foundation Model Strategies

创建于 更新于

摘要

本文提出将经典资本资产定价模型(CAPM)与贝叶斯不确定性分解结合,构建基础模型交易策略风险回报分析框架。通过该框架,利用蒙特卡洛 dropout 方法区分出由预训练基础模型引入的系统性(认知)风险和由微调引入的特有(属性)风险。实证中,基于不同预训练时序模型的策略在风险收益空间呈现高度聚集,通过剔除特有风险估计出基础模型理论最大夏普比率(即预训练市场线PML),并观察到模型随时间的alpha衰减趋势。研究揭示了基础模型交易策略中的系统性风险结构,对理解其风险溢价及市场动态具有重要意义 [page::0][page::1][page::3][page::4][page::5][page::6][page::7]

速读内容


结合CAPM与贝叶斯不确定性分解构建基础模型交易风险框架 [page::0][page::1][page::3]

  • 通过扩展经典资本市场线(CML),提出“预训练市场线”(PML)概念,代表使用预训练基础模型的最优风险收益权衡。

- 采用贝叶斯不确定性分解,将风险拆分为“认知不确定性”(系统性风险)和“属性不确定性”(特有风险)。
  • 利用蒙特卡洛 dropout 测量认知不确定性,区分价差中可分散的特有风险部分。


1秒级高频数据上的预测能力评估与模型选择 [page::4][page::5]


  • 以 TimesFMv2 模型为例,分析不同时间分辨率(100ms至1天)预测惊奇与市场回报的相关性。

- 发现超短(100ms)分辨率预测关联度最高,但考虑实际执行延迟,最终选定1秒分辨率用于后续实证。

预训练模型基础上的策略风险收益分布及PML夏普比率估计 [page::5][page::6]



| 模型类别 | 模型名 | 基础夏普比率 SRθ | R² |
|--------------|------------|-----------------|------|
| 传统基线 | LSTM | 3.44 ± 0.59 | 0.30 |
| 传统基线 | ALSTM | 3.19 ± 0.39 | 0.47 |
| 传统基线 | MLP | 1.73 ± 0.37 | 0.23 |
| 传统基线 | SFM | 2.85 ± 0.71 | 0.17 |
| 传统基线 | GRU | 2.77 ± 0.65 | 0.19 |
| 预训练基础模型 | TimesFM-v2 | 3.87 ± 0.18 | 0.86 |
| 预训练基础模型 | Moirai | 3.39 ± 0.16 | 0.86 |
| 预训练基础模型 | Chronos | 3.31 ± 0.17 | 0.83 |
| 预训练基础模型 | Timer | 2.77 ± 0.16 | 0.80 |
| 预训练基础模型 | TTM | 2.41 ± 0.17 | 0.72 |
  • 基础模型构建的策略在风险收益空间表现出更为紧凑的聚类,表明共享信号降低了策略结果的异质性。

- 通过剥除蒙特卡洛 dropout 估计的特有风险后,回归得到的夏普比率较高且稳定,验证了系统性风险的存在。

基础模型性能随时间的衰减趋势及市场同质化现象 [page::6][page::7]


  • 以 TimesFM-v1为例,采用滚动窗口方法,每周重新微调并评估策略表现。

- 理论最优夏普比率和实际策略夏普比率均呈现缓慢下降趋势,显示基础模型信号的alpha随市场普及程度和竞争加剧而衰减。
  • 模型版本发布节点对衰减趋势影响有限,体现市场适应基础模型策略的渐进过程。


量化研究主题与未来研究方向 [page::7]

  • 结构化分解风险,有助于更好理解基础模型带来的系统性风险溢价。

- 未来可拓展至多资产组合层面,研究多模型间共性系统风险。
  • 关注模型规模与推理延迟的平衡,探索轻量化方案提升实盘执行效率。

- 探索跨模型、跨资产类别的共享风险因子,为风险管理提供新视角。

深度阅读

研究报告详尽分析报告



---

1. 元数据与概览


  • 报告标题:《Trading with the Devil: Risk and Return in Foundation Model Strategies》

- 作者:Jinrui Zhang(清华大学,北京,中国)
  • 联系方式:zhangjr23@mails.tsinghua.edu.cn

- 发布时间与背景:报告基于近年的机器学习及金融交叉领域进展,涵盖2023年及前后时间点的相关模型与理论。
  • 研究主题:本报告围绕“基础模型(foundation models)”在金融时间序列交易中的风险与收益特征展开,特别是如何通过扩展经典的资本资产定价模型(CAPM)来剖析基于基础模型的交易策略的系统性与非系统性风险。

- 核心论点总结
- 基础模型正在金融时间序列任务中崭露头角,但其引入的系统性风险结构尚未被明确理解。
- 作者提出将CAPM风险拆分机制与机器学习中的不确定性拆分(贝叶斯范式中的认知不确定性epistemic和本质不确定性aleatory)相结合,构建“Pretrained Market Line”(PML)理论框架。
- 通过MC Dropout等贝叶斯不确定性量化方法,实际估计基于同一预训练基础模型的策略所面临的系统性风险,进而映射出真实的风险-收益空间。
- 实证基于不同市场和资产类别展示基础模型策略的表现和衰减规律,彰显该框架兼具理论创新与实践意义。

报告强调,基础模型可提升投资组合的夏普率上限,但同时也带来内在的“魔鬼式”风险(即共识与割裂带来的平衡挑战)。

---

2. 逐节深度解读



2.1 摘要与引言


  • 内容梳理

- 描述基础模型(尤其大规模时序模型)在金融领域日渐盛行,但尚缺乏对其风险属性的充分理解。
- 介绍CAPM中系统风险与非系统风险分解机制。
- 借助贝叶斯不确定性中的认知不确定性(epistemic uncertainty)与本质不确定性(aleatory uncertainty)对应CAPM的系统性风险和非系统性风险。
- 介绍提出的框架——PML,用以量化由预训练基础模型带来的风险收益平衡,并展示如何利用贝叶斯方法(如MC Dropout)实现风险拆分。
- 阐明研究的重要性和场景——市场中众多基于相同基础模型的策略在风险上可能显著相关。
  • 推理依据

- 传统CAPM观点和机器学习不确定性分类相似,促使作者提出统一视角。
- 以市场中普遍存在的同一基础模型作为“信息基线”,概念上等同于CAPM中的“市场投资组合”。
- 理论上若基线模型有价值,PML的斜率(夏普比率)将优于传统的CML。

---

2.2 图示分析(图1,Page 1)




  • 图表描述

- 左图示经典资本市场线(CML),将风险自由资产$Rf$与市场投资组合$M$连接,展示有效前沿与持有不同资产组合的风险收益关系。
- 右图为基础模型CAPM扩展,替换市场投资组合为策略$\theta
T$,基于同一基础模型。自定义微调策略$\thetas$则位于该PML下方(具有额外IDiosyncratic风险)。
- 两者横向对比展示结构对应关系,将不确定性分为系统性(基线模型驱动)和非系统性(微调引入)。
  • 解读与联系

- 该图式直观表达了作者提出的PML概念,强调在线性均值-方差空间中不可避免的系统风险来源于共同预训练模型。
- 蓝色虚线诠释理想策略$\theta
{\mathrm{opt}}$只承担基础模型的系统风险,额外风险即为非系统化风险,暗示基础模型微调提升空间。
- 本图为3.1-3.2小节的理论框架映射奠定直观基础。

---

2.3 理论背景与模型技术基础(Page 1-3)


  • 经典CAPM与均值-方差优化(2.1 & 2.2)


- 明确均值-方差优化背后的最小方差组合问题,定义最大夏普比率的“切线组合”。
- CML的公式精确诠释了风险自由利率、市场投资组合及其收益率和风险标准差的关系。
  • CAPM风险拆分(Eqns)


- 用贝塔系数表示资产或组合的系统性风险敞口。
- 总体风险拆分为系统风险和可分散风险($\sigma\varepsilon^2$),只有系统风险对应风险溢价。
  • 贝叶斯视角下的不确定性拆分(2.3)


- 介绍贝叶斯方法在捕获模型不确定性的作用。
- 详细阐述蒙特卡洛Dropout的原理:推理时保留Dropout形成贝叶斯后验样本集。
- 定义认知不确定性(epistemic):因模型知识不足、参数不确定产生,可通过更多数据和模型改进降低。
- 定义本质不确定性(aleatory):源于数据本身的随机性,不可去除。
- 强调两者区分对基础模型风险分解的重要性。

---

2.4 Foundation Model CAPM框架构建(Page 3)


  • 核心定义


- 预训练基础模型$\theta$引导的策略族$S(\theta)$,每个微调策略$\theta
s$对应收益均值$\mus$与波动率$\sigmas$。
- 引入切线策略$\thetaT$:无风险资产组合完全配置于风险资产,最大化夏普比,用于构建PML(Pretrained Market Line)。
- 对比经典CAPM中唯一市场投资组合$M$,此处$\theta
T$对应于最优基线模型微调策略。
  • 框架假设


- 完全共识:多投资者共享相同基础模型与信息基础,导致不同策略信号高度相关。
- 识别难题:$\thetaT$在实际中不可观测,需近似(类似市场投资组合不可直接观察,实用指标替代)。
  • 风险拆分与PML估计(3.3)


- 设定Aleatory Collapse假设,市场迅速消除基于本质不确定性的套利机会,剩余风险主要为认知不确定性构成的系统风险。
- 通过贝叶斯MC Dropout方法估计每个策略的认知不确定性(epistemic风险,$\sigma
{\mathrm{MC}}^2$)。
- 利用多个微调策略构成风险-收益点集,剔除非系统性风险,拟合PML的斜率即最大理论基础模型夏普比率$\mathrm{SR}\theta$。
- 该方法实现了对基础模型导出系统风险的量化估计,揭示不同策略间风险的可分解结构。

---

2.5 实验与实证(Page 4-7)



数据与任务设定


  • 高频数据来源

- 美国股票(S&P 500、Russell 2000)1秒级别NBBO报价。
- 加密货币(Binance交易所),100ms级别报价。
  • 单资产交易策略

- 采用不同基线模型与基础模型预测未来盘口中点价格。
- 策略基于预测信号产生买卖决策并通过回测评估收益与风险。
  • 模型与策略构建

- 预训练大型时序模型(TimesFM、Chronos、Moirai等)与传统模型(LSTM、MLP等)。
- 使用多样化超参数,形成丰富策略集映射风险-收益空间。

4.1 不同时间粒度预测能力


  • 通过分析模型“surprise”指标与未来收益相关系数,判别不同时间尺度的预测价值。

- 发现100ms至1s时间范围(短线高频)具较高正相关,信息优势快速衰减。
  • 选择1秒为实验统一标度,兼顾模型推理效率和预测有效性。


4.2 风险收益聚类与基础夏普比率估计


  • 图3详解(Page 6)



  • (a) 展示所有策略在平均每日收益(bps)与风险(收益标准差,bps)平面上的分布。

- 预训练模型策略(彩色点)分布紧凑,表现出共识风险收益特征。
- 非预训练基线策略(灰色点)分布更分散,多样性明显。
  • (b) 针对Chronos模型,展示不同参数规模对风险-收益的影响。

- 参数越大,策略均值收益上升,波动率下降,表明模型扩容带来信号质量提升。
- 说明规模与潜在交易收益呈正相关,然而推理延迟带来执行效率权衡。
  • 表2核心数据


| 模型分类 | 模型 | 基础夏普比率(SRθ) | 拟合优度(R²) |
|----------------|-----------|----------------------|----------------|
| 传统基线 | LSTM | 3.44 ± 0.59 | 0.30 |
| | ALSTM | 3.19 ± 0.39 | 0.47 |
| | MLP | 1.73 ± 0.37 | 0.23 |
| | SFM | 2.85 ± 0.71 | 0.17 |
| | GRU | 2.77 ± 0.65 | 0.19 |
| 预训练基础模型 | TimesFM-v2| 3.87 ± 0.18 | 0.86 |
| | Moirai | 3.39 ± 0.16 | 0.86 |
| | Chronos | 3.31 ± 0.17 | 0.83 |
| | Timer | 2.77 ± 0.16 | 0.80 |
| | TTM | 2.41 ± 0.17 | 0.72 |
  • 高R²值及夏普比率表明基础模型风险-收益表现紧密符合PML假设。

- 传统基线模型表现无此系统风险聚集现象,表现多样分散。

4.3 基础模型衰减(Alpha Decay)


  • 图4详解(Page 7)



  • 横轴:时间跨度2023年初至2025年初。

- 曲线:
- 金色:理论最大夏普比率$\operatorname{SR}
\theta$,即PML斜率估计,反映基础模型的潜在收益上限。
- 栗色:实测策略夏普比率$\mathrm{SR}{\thetas}$。
  • 观察到长期趋弱的夏普比率,暗示市场吸收基础模型信号导致alpha收益逐步消逝。

- TimesFM-v1及v2发布点仅带来轻微不连续,无显著逆转,表明衰减为渐进型过程。
  • 利用该指标可监测基础模型信号的市场价值动态、饱和度和过时风险。


---

2.6 限制与未来方向(Page 6-7)


  • 多资产组合扩展:目前研究限于单资产策略,未来可拓展至跨资产、组合层面,检验CAPM分解框架对系统风险的普适性与可传递性。

- 模型规模与执行效率权衡:更大规模模型表现更好但推理延迟增加,未来研究需关注模型压缩与加速技术(量化、蒸馏、剪枝)以提升实用性。
  • 跨模型风险因素识别:现阶段独立分析各模型族,后续可探讨多模型间共享风险因子,以揭示更普遍的基础模型风险结构。


---

2.7 相关工作理论回顾(Page 6-7)


  • 金融风险管理综述:回顾VaR、CVaR等主流风险测度及其局限,强调贝叶斯混合方法对尾部风险建模的优势。

- 机器学习不确定性建模:重点介绍MC Dropout、深度集成(Deep Ensembles)、Laplace近似等方法,及不确定性的Aleatoric与Epistemic拆分。
  • 强调现有拆分在细粒度任务中相关性仍较高,说明具体领域(如金融)专门化风险解读的必要性,契合本研究创新点。


---

2.8 结论(Page 7)


  • 成功将CAPM理论框架拓展到基于基础模型的金融交易策略中,通过贝叶斯不确定性方法实现系统与非系统风险的区分。

- 发现基础模型策略表现出一致的系统风险结构且其风险溢价对应于模型固有的认知不确定性。
  • 通过PML估计,揭示alpha收益随市场的不断“吸收”表现出逐步衰退趋势。

- 该框架为理解基础模型在金融风控和策略构建中的作用提供了革命性视角,对风险管理和模型部署均有深远影响。

---

3. 图表深度解读



3.1 图1(Page 1)


  • 该图形象对比了传统的CML与新提出的PML架构。

- 左图经典意义:风险自由资产与市场投资组合之间构建最优风险-收益组合。
  • 右图创新:将市场投资组合替换成充分利用基础模型的切线策略$\thetaT$,并引入具体策略$\thetas$与理想策略$\theta{\mathrm{opt}}$,两者间距离代表非系统风险。

- 强调了引入基础模型后策略风险的可分解性及其估计困难性,奠定后续贝叶斯不确定性拆分基础。

3.2 图2(Page 5)


  • 选取TimesFMv2模型,展示在100ms(高频)和1日(低频)两档次下“surprise”与未来收益相关系数。

- 100ms图显示强烈正相关峰值及快速衰减,暗示高频市场存在短暂可利用价格异象。
  • 1日图显示相关性幅度远低,且快速围绕零波动,体现日频信号不强或市场效率较高。

- 选择1秒分辨率,平衡模型性能与市场执行能力。

3.3 图3(Page 6)


  • (a)多种模型策略风险-收益分布对比,预训练模型策略表现更集中,说明共享信号驱动风险收益特征聚合。

- (b)Chronos不同规模模型展示,模型参数由8M至710M,随规模增加平均回报提升,风险降低,提示规模效应。
  • 结合表2,预训练模型的PML斜率更高且拟合更好,说明共享风险显著。


3.4 图4(Page 7)


  • TimesFM-v1周度滚动训练策略夏普比的动态演化。

- 理论上限(黄金色)和实际策略表现(棕色)逐步下降,暗示Base model信号被市场融合,alpha消退。
  • 发布节点对趋势没有实质逆转,反映市场逐渐适应并降低策略边际收益。

- 该动态视角为监控基础模型策略生命周期提供工具。

---

4. 估值分析



本报告核心聚焦于风险与收益的均值-方差估计和CAPM夏普比率形式的系统风险估计,非直接的企业估值分析,因此未涉及传统DCF或企业估值倍数法。报告以基础模型提供的策略收益与波动率为主体数据,通过统计回归(风险调整收益)估计“基础夏普比率”(Foundation Sharpe Ratio),相当于基于风险调整后的超额收益率回报率的估值指标。

PML理论为该“风险-收益定价”量化方法提供理论支撑,并利用贝叶斯不确定性量化划分风险内涵,实现了对交易策略有效边界的估值映射。从数据角度,估值基于高频期权数据,回测结果在传统资产和加密资产均有体现。

---

5. 风险因素评估


  • 系统性风险:由共享基础模型架构驱动的认知不确定性,影响所有基于同一模型衍生的交易策略,是不可分散的市场风险。

- 非系统性风险:由具体策略的自定义微调带来的额外不确定性,对应CAPM中的idiosyncratic风险,可通过组合多样化消除。
  • 模型退化风险:基础模型随市场环境变化而衰退导致夏普比下降,策略有效性的自然衰退。

- 潜在模式崩溃:假设的Aleatory Collapse假定市场迅速消除基于本质不确定性的套利机会,然而现实市场可能存在突发事件导致模型失效。
  • 执行与延迟风险:大规模模型推理延迟与市场快节奏反应之间的权衡阻碍了理论上的收益实现。

- 风险缓解
- 利用贝叶斯不确定性度量方法精准识别可控与不可控风险。
- 基于滚动窗口监控模型状态和alpha衰减,便于及时调整策略。

---

6. 审慎视角与细微差别


  • 假设严格性

- Aleatory Collapse假设市场高效且套利者迅速消除不可预测风险,这在实际异常事件尤为脆弱,可能高估模型对风险的解读。
- 完全共识假设在多投资者极度信息共享场景下成立,现实中信息不对称仍然广泛存在。
  • 模型指标外推限制

- 实验聚焦单资产,忽略组合层面风险传播和动态对冲机制,未来实际投资组合中复杂度更大。
  • 风险拆分工具的局限

- MC Dropout虽为有效贝叶斯近似,却非完全优化贝叶斯后验,度量误差仍可能对结论产生潜在偏差。
  • 因果关系未完全明确

- 虽展示了共识风险和alpha衰减,但缺少对机制和外部环境(如政策、技术革新)影响的深度解析。
  • 统计稳健性

- 部分传统模型基线拟合结果分散,可能源于采样限制或模型结构欠缺共享信号机制,影响比较效果。
  • 图表多样性

- 报告中对多模型跨资产分析暂未完成,风险因子独立性和共性仍需进一步证实。

---

7. 结论性综合



本研究原创性地将经典金融理论CAPM中的系统性与非系统性风险拆分,与机器学习领域的贝叶斯不确定性分类相结合,提出了“基础模型市场线”(Pretrained Market Line,PML)框架,系统分析基于同一预训练时序模型产生的多策略群体的风险收益特征。
  • 理论贡献

- 通过定义切线策略$\theta
T$和PML,创设基础模型驱动的风险收益标尺,突破传统资产市场的范畴,引入新的统计与金融视角融合。
- 采用贝叶斯MC Dropout等技术量化认知不确定性(epistemic risk),实现策略风险的结构性拆分,揭示非系统性风险对应策略细节定制,构建基础模型风险图谱。
  • 实验验证

- 利用高频美国股票及加密货币市场数据,覆盖多个预训练模型与常规模型基线,展示基础模型策略的风险收益聚集和可识别的Foundation Sharpe Ratios。
- 探索模型扩容对风险收益的正面影响及推理延迟带来的折中,验证了规模与执行效率间权衡的现实挑战。
- 通过滚动窗口PML估计,揭示基础模型策略alpha收益的缓慢衰减趋势,回应市场信息传播与同步化进程。
  • 应用价值

- 该理论工具为量化金融实践中针对基础模型构建策略提供了风险分解框架,促进更透明和科学的风险管理。
- 可辅助投资者识别策略中可控风险与不可控风险,优化资本配置。
  • 图表支持视角

- 图1构建PML理论架构。
- 图2展示模型预测能力时间尺度依赖。
- 图3呈现策略风险收益分布及模型扩容效应。
- 图4追踪模型alpha衰退,提供动态风险管理信息。

综上,作者展现了一条融合金融理论与现代机器学习贝叶斯技术的新途径,将基础模型的“魔鬼”(风险)与“天使”(alpha)共生关系科学化、量化,为未来大规模模型金融应用研究奠定坚实基础。[page::0,1,2,3,4,5,6,7]

---

注:上述引用页码对应报告内容所在页,便于追溯与核对。

报告